vad函数matlab代码-pyBK:基于二进位说话人建模的说话人差异化python系统

时间:2024-06-09 07:28:45
【文件属性】:

文件名称:vad函数matlab代码-pyBK:基于二进位说话人建模的说话人差异化python系统

文件大小:27.16MB

文件格式:ZIP

更新时间:2024-06-09 07:28:45

系统开源

vad函数matlab代码pyBK-基于二进制关键说话人建模的说话人差异化python系统 所提供的系统在给定的音频文件列表上执行说话者二值化(在同声说话者群中进行语音分割和聚类)。 它基于该技术。 由于对二进制密钥背景模型(KBM)进行了会期培训,因此该系统不需要任何外部培训数据,从而为说话者区分任务提供了易于运行和调整的选项。 描述 此实现基于的实现,也可用于。 除了与二进制密钥相关的代码外,还包括用于扬声器数字化系统管线的有用功能。 在我们参与了所描述的,中的,和中的解释之后,添加了额外的细节和功能。 安装 这段代码是使用conda在python 3.6中编写和测试的。 它依靠一些常见的程序包来完成任务: 用于音频处理和特征提取 用于语音活动检测 如果您使用的是conda: $ conda create -n pyBK python=3.6 $ source activate pyBK $ conda install numpy $ conda install -c conda-forge librosa $ pip install webrtcvad $ git clone h


【文件预览】:
pyBK-master
----config_DIHARD.ini(5KB)
----uem()
--------3056696.uem(2B)
--------3063115.uem(2B)
--------3055877.uem(2B)
--------3057402.uem(2B)
--------3054300.uem(0B)
----sad()
--------3055877.lbl(213B)
--------3054300.lbl(1KB)
--------3063115.lbl(1KB)
--------3056696.lbl(815B)
--------3057402.lbl(386B)
----LICENSE(1KB)
----config.ini(5KB)
----README.md(5KB)
----eval-tools()
--------reference.rttm(9KB)
--------md-eval-v21.pl(105KB)
----audio()
--------3056696.wav(11.61MB)
--------3054300.wav(3.12MB)
--------3057402.wav(10.65MB)
--------3063115.wav(8.64MB)
--------3055877.wav(2.88MB)
----main.py(9KB)
----.gitattributes(49B)
----diarizationFunctions.py(37KB)

网友评论