文件名称:使用机器学习进行英语口音分类和转换-研究论文
文件大小:323KB
文件格式:PDF
更新时间:2024-06-09 14:28:36
Accent Detection Accent Conversion DNN
语言被认为是人类交流不可或缺的一部分。 有时,由于口音不相似,可能无法适当地理解说母语的人和说母语的人一样流利。 而且,由于语音中的微妙的异质性,检测人的口音本身构成了艰巨的任务。 为了减少由于口音差异而引起的这些通信障碍,我们提出了一种检测和转换语音的系统,该系统可以方便地将一种口音与另一种口音区分开,已达到68.67%的准确度。 主要动机是解决印度人理解外国口音和外国人理解印度口音的困难。 该项目的范围将限于英语。 口音的检测将涉及识别说话者的母语。 我们介绍了一种通过将卷积神经网络(CNN)与深度神经网络(DNN)和递归神经网络(RNN)融合在一起来增强传统锻炼技术的新方法,从而提高了准确性。 对于重音转换,音频功能主要包括梅尔频率倒谱系数(MFCC),非周期性(AP)和基本频率(F0)。 一旦提取出这些特征,则由对抗性生成网络(GAN)处理,以将源重音转换为目标重音。