文件名称:Speech-Processing-Basic-Concepts:基本概念
文件大小:22KB
文件格式:ZIP
更新时间:2024-04-10 21:03:33
JupyterNotebook
语音处理基本概念 基本概念:发音语音–语音的发展和分类;声学语音学–语音产生的声学;审查数字信号处理概念;语音分析的短时傅立叶变换,滤波器组和LPC方法技术:特征,特征提取和模式比较:对数频谱距离,倒谱距离,加权倒频谱距离和滤波,似然失真,使用翘曲频率标度的频谱失真,LPC,PLP和MFCC系数都是统计和感知语音失真度量。多个时间–对齐路径,动态时间扭曲以及时间对齐和规范化注释 如何使用python将.mp3转换为.wav pip安装pydub 点安装软件-属性-常见 ** pip安装ffmpeg ****** 将音频文件转换为文本步骤:导入语音识别库初始化识别器类以识别语音。我们正在使用谷歌语音识别。语音识别支持音频文件:wav,AIFF,AIFF-C,FLAC。在此示例中,我使用了“ wav”文件 !pip安装SpeechRecognition
【文件预览】:
Speech-Processing-Basic-Concepts-main
----Mp3towav.ipynb(2KB)
----Convert_audio_file_into_text.ipynb(2KB)
----generate_silence.ipynb(28KB)
----README.md(1KB)