文件名称:语音合成代码matlab-ldm_speech_synthesis:ldm_speech_synthesis
文件大小:244KB
文件格式:ZIP
更新时间:2024-06-16 16:31:38
系统开源
语音合成代码matlab LDM语音合成 使用线性动力学模型(LDM)进行语音合成。 该任务分为两个部分: 准备数据集:给定一个包含语音及其转录的数据集,我们将处理用于训练语音合成模型的数据。 的前端是用于预处理数据的好工具。 使用处理后的数据训练LDM。 所需工具 我们将飓风挑战用作我们的数据集。 为了使用此数据集,您需要先接受并获取密码。 我们使用该语料库的“普通”(不是伦巴第)新闻句子(名为herald_xxx)和“普通”哈佛句子(hvd_xx)。 但是,还有其他可用的开源数据集也可以在这里使用。 如果您想要一个没有任何许可证问题的数据集,那将是一个很好的起点。 但是,它是一个相对较小的数据集。 是TTS的相当大的数据集。 要准备数据集,请使用以下工具: 带有unilex词典的节日:我们用作从文本中获取语音转录的前端。 由于数据集的讲者是英语使用者,因此我们使用unilex而不是默认的CMU词典进行转录。 此词典仅在以后可用。 :我们使用HTK将语音转录与其在语音发音中的位置对齐。 您可能会在源代码中遇到需要修复的。 :我们使用SPTK进行音频数据的信号处理。 :我们使用世界声码