【文件属性】:
文件名称:diffwave:DiffWave是一种快速,高质量的神经声码器和波形合成器
文件大小:18KB
文件格式:ZIP
更新时间:2021-05-02 07:10:54
machine-learning text-to-speech neural-network paper speech
差异波
DiffWave是一种快速,高质量的神经声码器和波形合成器。 它以高斯噪声开始,并通过迭代细化将其转换为语音。 可以通过提供条件信号(例如,对数比例的梅尔频谱图)来控制语音。 有关模型和体系结构的详细信息,请 。
新增功能(2021-04-01)
基于DiffWave论文v3的快速采样算法
新增功能(2020-10-14)
新的预训练模型经过了1M步的训练
使用新模型的输出更新了音频样本
状态(2021-04-01)
快速推断程序
稳定训练
高质量合成
混合精度训练
多GPU训练
命令行推断
程序推理API
PyPI包
音频样本
预训练模型
无条件波形合成
非常感谢 (DiffWave的主要作者)提供的指针和错误修复。
音频样本
预训练模型
(31 MB,SHA256: d415d2117bb0bba3999afabdd67ed11d9e43400af2
【文件预览】:
diffwave-master
----LICENSE(11KB)
----src()
--------diffwave()
----setup.py(2KB)
----README.md(4KB)