文件名称:voice-conversion:机器学习课程项目,将源语音转换为目标语音
文件大小:60KB
文件格式:ZIP
更新时间:2024-06-05 22:34:16
Python
语音转换 抽象的 语音转换任务涉及将语音从一个说话者(源)的语音转换为另一说话者(目标)的语音。 可以使机器学习方法比普通信号处理技术执行得更好,因为它们可以考虑语音的多个特征,而信号处理技术无法轻松地表征这些特征。 在这个项目中,我们探索了使用递归神经网络(RNN)进行语音转换。 我们使用LSTM和GRU探索了RNN的多种变体,并观察了更改模型各个参数的影响。 我们的方法使用了两个独立训练的神经网络-一个将源语音转换为音素,另一个将语音转换为目标语音。 我们将介绍两个网络针对这些不同参数所获得的结果。 数据集 我们利用了TIMIT数据集,该数据集具有630位说话者的发声的帧级音素转录,用于训练第一个神经网络。 此外,我们还使用CMU Arctic数据集来训练第二个神经网络。 北极数据集包含来自单个雄性和雌性说话人(目标)的1150言语。 方法 我们已经使用了递归神经网络的序列到序列方法。
【文件预览】:
voice-conversion-master
----train_bidirectional_lstm.py(18KB)
----predict2.py(15KB)
----train.py(18KB)
----train2mag_bidirectional_gru.py(18KB)
----train2mag_pyramidal_bidirectional_gru.py(17KB)
----train2_pyramidal_bidirectional_gru.py(20KB)
----predict.py(8KB)
----train_unidirectional_lstm.py(18KB)
----predict2mag.py(12KB)
----SA1.PHN(594B)
----train2_bidirectional_gru.py(20KB)
----hyperparams.py(2KB)
----train_bidirectional_gru.py(17KB)
----convert.py(5KB)
----.gitignore(114B)
----end_to_end_predict.py(531B)
----README.md(2KB)
----arctic_a0001.lab(550B)