文件名称:lpcmatlab代码-Senior_Project:高级设计最终项目2018
文件大小:10.57MB
文件格式:ZIP
更新时间:2024-06-12 12:13:33
系统开源
lpc matlab代码机器学习的语音处理 贡献者 学术顾问:李坦 塞德里克·贝克 杨明俊 詹璇梅 抽象的 该项目的目的是开发使用神经网络的语音识别系统。 该系统已通过两个主要的软件步骤和一个硬件实现来实现。 后续步骤依赖于先前步骤的精度来为整个系统实现更高的精度。 特征提取是该系统中的首要步骤,因此也是最重要的步骤之一。 线性预测编码(LPC)方法被考虑用于特征提取,但仅从语音信号中产生10个特征,而梅尔频率发散系数(MFCC)提取26个特征,从而可以更高分辨率地显示波形。 神经网络的许多形式都针对单词预测系统进行了尝试和测试。 这些网络包括K最近邻居(KNN),人工神经网络(ANN),卷积神经网络(CNN)和名为MFCC图像的小组,该机制是使用MFCC提取特征并构建图像进行训练和驱动的方法CNN。 以上所有方法均使用MATLAB:trade_mark:实现和完善。 后来,在Arduino 101:trade_mark:上构建了使用小得多的ANN的硬件实现,并使用了经过MATLAB:trade_mark:训练的权重。 由于Arduino 101:trade_mark:中内存不足,因此较小的神经网络只有2层,并且仅使用MFCC提取过程中提供的26个功能中的10个。 由于硬