文件名称:pyannote-audio:说话人分类的神经构建块
文件大小:12.49MB
文件格式:ZIP
更新时间:2024-08-13 03:22:16
pytorch pretrained-models speaker-recognition speaker-verification speech-processing
:warning: 结帐分支以查看pyannote.audio 2.0 中的内容: 一个更小更干净的代码库 Python-first API(不过,旧的pyannote-audio CLI 仍然可用) 多 GPU 和 TPU 训练 使用数据增强 模特主持 音频注释的食谱 基于在线 使用pyannote-audio神经说话者分类 pyannote.audio是一个用 Python 编写的用于说话人分类的开源工具包。 基于机器学习框架,它提供了一组可训练的端到端神经构建块,可以组合和联合优化来构建说话人分类管道: pyannote.audio还带有涵盖了语音活动检测、说话人变化检测、重叠语音检测和说话人嵌入的广泛领域: 安装 pyannote.audio在 Linux 和 macOS 上仅支持 Python 3.7(或更高版本)。 它可能适用于 Windows,但没有任何保证,也没有任何计划添加对