文件名称:Discriminative-Sounding-Objects-Localization:区分性探空对象本地化代码(NeurIPS 2020)
文件大小:8.03MB
文件格式:ZIP
更新时间:2024-06-20 04:19:36
Python
区分性探空对象本地化 我们的NeurIPS 2020论文代码,(先前的标题是“学会在鸡尾酒会场景中区分性地对发声对象进行本地化” )。 代码是在 PyTorch 上用 python3 实现的。 要求 火炬 1.1 火炬视觉 scikit 学习 解放军 枕头 opencv 运行程序 对于在Music或AudioSet-instrument上进行的实验,训练和评估过程分别相似,分别在文件夹music-exp和audioset-instrument 。 在这里,我们以 Music 数据集上的实验为例。 数据准备 下载数据集,例如 MUSIC,并拆分为训练/验证/测试集。 具体来说,对于 training@stage_one,请使用 。 对于训练@ stage_two,我们用音乐剪辑合成。 通过运行以 4 fps 提取帧 python3 data/cut_video.py 提取1秒的音频剪辑
【文件预览】:
Discriminative-Sounding-Objects-Localization-master
----.gitignore(2KB)
----readme()
--------multi.PNG(132KB)
--------eg1.PNG(470KB)
--------solo.PNG(91KB)
--------eg2.PNG(1.06MB)
----LICENSE(1KB)
----.DS_Store(8KB)
----README.md(4KB)
----compared model()
--------location_attention_stage_one.py(8KB)
--------attention_net.py(2KB)
--------visualization_attention.py(7KB)
--------Sound-of-Pixels()
--------dmc_model.py(3KB)
--------location_dmc_stage_one.py(8KB)
----music-exp()
--------solotest.json(2.49MB)
--------data()
--------test_stage_two_duet.py(11KB)
--------model()
--------eval.py(3KB)
--------duettest.json(2.68MB)
--------test.py(9KB)
--------training_stage_one.py(18KB)
--------training_stage_two_duet.py(10KB)
--------tools.py(2KB)
--------match_cluster.py(2KB)
--------test_stage_two.py(12KB)
--------eval_duet.py(4KB)
--------training_stage_two.py(10KB)
----audioset-instrument()
--------data()
--------model()
--------.DS_Store(6KB)
--------scripts()
--------audioset_box.json(786KB)
--------training_stage_one.py(14KB)
--------training_stage_two.py(8KB)
----.gitattributes(66B)