wavegrad:快速,高质量的神经声码器

时间:2024-05-03 15:40:52
【文件属性】:

文件名称:wavegrad:快速,高质量的神经声码器

文件大小:20KB

文件格式:ZIP

更新时间:2024-05-03 15:40:52

machine-learning text-to-speech neural-network paper speech

WaveGrad WaveGrad是Google Brain的人员设计的一种快速,高质量的神经声码器。 描述了该体系结构。 简而言之,该模型采用对数比例的梅尔频谱图,并通过迭代精化将其转换为波形。 状态(2020-10-15) 稳定训练(22 kHz,24 kHz) 高质量合成 混合精度训练 多GPU训练 自定义噪声时间表(更快的推断) 命令行推断 程序推理API PyPI包 音频样本 预训练模型 预先计算的噪声时间表 音频样本 预训练模型 (183 MB,SHA256: 65e9366da318d58d60d2c78416559351ad16971de906e53b415836c068e335f3 ) 安装 使用pip安装: pip install wavegrad 或从GitHub: git clone https://github.com/lmnt-com


【文件预览】:
wavegrad-master
----setup.py(2KB)
----src()
--------wavegrad()
----LICENSE(11KB)
----README.md(4KB)

网友评论