文件名称:diffwave:DiffWave是一种快速,高质量的神经声码器和波形合成器
文件大小:18KB
文件格式:ZIP
更新时间:2024-05-22 00:57:34
machine-learning text-to-speech neural-network paper speech
差异波 DiffWave是一种快速,高质量的神经声码器和波形合成器。 它以高斯噪声开始,并通过迭代细化将其转换为语音。 可以通过提供条件信号(例如,对数比例的梅尔频谱图)来控制语音。 有关模型和体系结构的详细信息,请 。 新增功能(2021-04-01) 基于DiffWave论文v3的快速采样算法 新增功能(2020-10-14) 新的预训练模型经过了1M步的训练 使用新模型的输出更新了音频样本 状态(2021-04-01) 快速推断程序 稳定训练 高质量合成 混合精度训练 多GPU训练 命令行推断 程序推理API PyPI包 音频样本 预训练模型 无条件波形合成 非常感谢 (DiffWave的主要作者)提供的指针和错误修复。 音频样本 预训练模型 (31 MB,SHA256: d415d2117bb0bba3999afabdd67ed11d9e43400af2
【文件预览】:
diffwave-master
----LICENSE(11KB)
----src()
--------diffwave()
----setup.py(2KB)
----README.md(4KB)