文件名称:PyTorch_Speaker_Verification
文件大小:276.23MB
文件格式:ZIP
更新时间:2024-03-10 10:20:27
C
PyTorch_Speaker_Verification 语音嵌入网络和损失的PyTorch实施在此处描述: ://arxiv.org/pdf/1710.10467.pdf。 还包含用于创建嵌入的代码,这些嵌入可作为在找到的说话人差异化模型的输入兼容 TIMIT语音语料库用于训练模型,可在以下位置找到: : 或此处, 依存关系 PyTorch 0.4.1 python 3.5+ numpy的1.15.4 librosa 0.6.1 在上找到的python WebRTC VAD是创建运行dvector_create.py所必需的,而不是训练神经网络。 预处理 将以下config.yaml密钥更改为包含下载的TIMIT数据集中的所有.WAV文件的正则表达式。 对于dvector_create.py脚本,必须将TIMIT .WAV文件转换为标准格式(RIFF),但对于训练神经