文件名称:asv-subtools:用于说话人识别的开源工具
文件大小:4.13MB
文件格式:ZIP
更新时间:2024-05-23 05:37:33
Python
ASV-Subtools:用于说话者识别的开源工具 ASV-Subtools是基于和开发的,用于说话人识别,语言识别等任务。 “子工具”的“子”意味着有许多模块化工具,并且零件构成了整体。 版权所有: (中国厦门大学) 阿帕奇2.0 作者:赵:(雪人),周建峰,李立,卢浩,童富川目前的维护者:付富川合著者:李琳,洪庆阳 内容 训练基于Kaldi的多任务学习模型 加速Kaldi的X向量提取器 为后端添加MMI-GMM分类器 训练模式 食谱 [1] Voxceleb食谱[说话者识别] [2] 2020年AP-OLR挑战赛基线食谱[语言识别] 反馈 致谢 介绍 在ASV-Subtools中, Kaldi用于提取声学特征并在后端进行评分,而Pytorch用于*构建模型并以自定义样式对其进行训练。 如下所示的项目结构,培训框架和数据管道可以帮助您深入了解ASV-Subtools。