【文件属性】:
文件名称:语音合成代码matlab-ldm_speech_synthesis:ldm_speech_synthesis
文件大小:244KB
文件格式:ZIP
更新时间:2021-05-27 22:44:58
系统开源
语音合成代码matlab
LDM语音合成
使用线性动力学模型(LDM)进行语音合成。
该任务分为两个部分:
准备数据集:给定一个包含语音及其转录的数据集,我们将处理用于训练语音合成模型的数据。
的前端是用于预处理数据的好工具。
使用处理后的数据训练LDM。
所需工具
我们将飓风挑战用作我们的数据集。
为了使用此数据集,您需要先接受并获取密码。
我们使用该语料库的“普通”(不是伦巴第)新闻句子(名为herald_xxx)和“普通”哈佛句子(hvd_xx)。
但是,还有其他可用的开源数据集也可以在这里使用。
如果您想要一个没有任何许可证问题的数据集,那将是一个很好的起点。
但是,它是一个相对较小的数据集。
是TTS的相当大的数据集。
要准备数据集,请使用以下工具:
带有unilex词典的节日:我们用作从文本中获取语音转录的前端。
由于数据集的讲者是英语使用者,因此我们使用unilex而不是默认的CMU词典进行转录。
此词典仅在以后可用。
:我们使用HTK将语音转录与其在语音发音中的位置对齐。
您可能会在源代码中遇到需要修复的。
:我们使用SPTK进行音频数据的信号处理。
:我们使用世界声码