文件名称:Speaker_identification_-GMM-UBM-
文件大小:141.41MB
文件格式:ZIP
更新时间:2024-04-27 11:10:22
Python
Speaker_identification_-GMM-UBM-系统 系统有几个要求,需要安装库才能正确运行: 斯克莱恩 python_speech_features pydub 作业库 scipy.io matplotlib.pyplot 大熊猫 海生的 该系统可处理.WAV文件,建议启动某些文件夹中的'convert.sh'文件,以转换为上述.ogg或.mp3文件格式并重新采样至16kHz。 ``data''文件夹中包含几个文件夹,每个文件夹的用法如下所述: ''gmm_dataset'':必须包含用于系统培训的文件(必须读取演讲者的姓名) ''模型'':此文件夹包含已存储扬声器的.pkl模型 ''temp'':将要分割的文件插入此文件夹 ''splitd'':在此文件夹中,将从''temp''文件夹中存在的音频开始创建分割 ''测试'':在此处插入测试文件 ''ubm