文件名称:AudioMLProject1:语音活动检测
文件大小:20KB
文件格式:ZIP
更新时间:2024-06-28 09:35:50
Python
Python 中基于音频的机器学习:作业 1 目标 将语音语料库与噪音混合; 折叠脉冲响应 提取 MFCC 特征 使用带有交叉验证的开箱即用分类器(随机森林、SVM、神经网络等)进行语音活动检测 展示你的结果 细节和限制 在这第一个介绍性作业中,您将创建一个数据集来模拟日常场景中的语音。 您将在此数据集上训练分类器以区分浊音部分和非浊音部分,这项任务称为语音活动检测,简称为 VAD。 当然,这需要 VAD 注释方面的基本事实。 格式转换器.py 将噪声文件的格式转换为 int_16 类型。 我们将所有噪声文件转换为 int_16 格式并将它们保存在一个新文件夹中,该文件夹将进一步用于生成数据集。 Usage: python format_convertor.py Speech_noise_ir_audio_mixing_script.py 在给定的“输出”目录中生成带有自定义命令
【文件预览】:
AudioMLProject1-master
----.gitignore(21B)
----classification_report.py(3KB)
----classifier_test.py(4KB)
----AdaBoostClassifier.py(4KB)
----README.md(9KB)
----svm_modelling.py(2KB)
----speech_noise_ir_audio_mixing_script.py(8KB)
----input_and_target_dataset_generator.py(4KB)
----format_convertor.py(622B)
----estimate_svm_parameters.py(4KB)
----estimate_liblinear_svm_parameters.py(3KB)
----RandomForestClassifier.py(4KB)
----input_and_target_dataset_mfcc_26D.py(4KB)