SC-WaveRNN:扬声器条件WaveRNN的PyTorch官方实现

时间:2024-05-13 00:26:33
【文件属性】:

文件名称:SC-WaveRNN:扬声器条件WaveRNN的PyTorch官方实现

文件大小:114KB

文件格式:ZIP

更新时间:2024-05-13 00:26:33

Python

SC-WaveRNN 扬声器条件WaveRNN:面向看不见的扬声器和录音条件的通用神经声码器 Dipjyoti Paul a ,Yannis Pantazis b和Yannis Stylianou a 克里特岛的计算机科学系,大学 b仪器和计算数学学院,研究和技术基金会-Hellas 抽象的: 深度学习的最新进展导致了单说话者语音合成中人类水平的表现。 但是,当将这些系统推广到多扬声器模型时,尤其是对于看不见的讲话者和看不见的录音质量,在语音质量方面仍然存在局限性。 例如,常规的神经声码器被调整为训练说话者,并且对于看不见的说话者具有较差的泛化能力。 在这项工作中,我们提出了WaveRNN的一种变体,称为说话者条件WaveRNN(SC-WaveRNN)。 我们致力于开发高效的通用声码器,甚至适用于看不见的扬声器和录音条件。 与标准WaveRNN相比,SC-WaveRNN利用以扬声器嵌


【文件预览】:
SC-WaveRNN-master
----utils()
--------text()
--------distribution.py(5KB)
--------dataset.py(7KB)
--------__init__.py(0B)
--------display.py(3KB)
--------dsp.py(2KB)
--------paths.py(2KB)
--------files.py(199B)
----models()
--------tacotron.py(17KB)
--------deepmind_version.py(7KB)
--------fatchord_version.py(15KB)
----hparams.py(4KB)
----train_tacotron.py(5KB)
----gen_tacotron.py(6KB)
----requirements.txt(62B)
----assets()
--------Tacotron_spk_embd.jpg(30KB)
--------WaveRNN_spk_embd.jpg(81KB)
----sentences.txt(463B)
----README.md(4KB)
----gen_wavernn.py(5KB)
----_config.yml(26B)
----preprocess.py(2KB)
----train_wavernn.py(4KB)

网友评论