文件名称:PerceptualAudio:音频的感知指标-感知相关的损失函数。 DPAM和CDPAM
文件大小:23MB
文件格式:ZIP
更新时间:2024-06-11 06:36:03
perceptual-metrics jnd-dataset jnd-framework perceptual-audio-metric audio-loss-function
深度感知音频指标(DPAM) 另外,请我们更新的改进指标: 从明显的差异中学到的可区分的感知音频指标 , , , , J.Mysore , Zeyu Jin 在2020年国际语音交流大会上被接受 这是我们的音频感知指标的Tensorflow实现(此处是pytorch实现)。 它包含(0)运行我们的感知度量(DPAM)的最少代码,(1)在我们的JND数据集上训练感知度量的代码,以及(2)使用我们的感知度量作为语音降噪损失函数的示例。 还要签出我们最新学习的指标:CDPAM:基于对比学习的深度感知音频相似性指标 请参阅cd cdpam并按照自述文件中的说明进行操作。 我们还提供以下方面的预训练模型: 我们利用CDPAM训练波形合成模型。 我们从这里开始使用代码库。 我们训练单扬声器和跨扬声器模型。 实时语音增强:我们利用CDPAM作为损失函数来训练SE模型。 我
【文件预览】:
PerceptualAudio-master
----metric_code()
--------helper.py(12KB)
--------dataloader.py(11KB)
--------summaries()
--------saved_distances()
--------helper.pyc(13KB)
--------network_model.pyc(3KB)
--------dataloader.pyc(9KB)
--------main.py(11KB)
--------network_model.py(4KB)
--------README.md(4KB)
--------metric_use_simple.py(6KB)
--------metric_use.py(6KB)
----example_pip.py(186B)
----sample_audio()
--------ref.wav(108KB)
--------4.wav(108KB)
--------2.wav(108KB)
----pre-model()
--------scratch_loss()
--------linear_layer_loss()
--------pretrained_loss()
--------se_model()
--------finetune_loss()
----requirements.txt(90B)
----dataset()
--------dataset_dummy_jnd.txt(7KB)
--------dataset_combined.txt(749KB)
--------dataset_reverb.txt(435KB)
--------README.md(3KB)
--------licence.txt(17KB)
--------dataset_linear.txt(919KB)
--------dataset_eq.txt(367KB)
----LICENSE(1KB)
----se_code()
--------helper.py(12KB)
--------data_import.pyc(6KB)
--------summaries()
--------data_import.py(7KB)
--------helper.pyc(12KB)
--------network_model.pyc(3KB)
--------network_model.py(5KB)
--------dataset()
--------se_infer.py(2KB)
--------se_train.py(8KB)
--------README.md(2KB)
----dpam()
--------helper.py(12KB)
--------__init__.pyc(2KB)
--------dpam.py(7KB)
--------helper.pyc(13KB)
--------network_model.pyc(4KB)
--------pre-model()
--------__init__.py(2KB)
--------network_model.py(4KB)
--------setup.py(514B)
----README.md(12KB)
----cdpam()
--------requirements.txt(147B)
--------README.md(3KB)
--------sample(0B)
----create_space()
--------sample.py(6KB)
--------main.py(353B)
--------README.md(760B)