文件名称:voxseg:用于语音非语音分段的语音活动检测(VAD)的python库
文件大小:36.16MB
文件格式:ZIP
更新时间:2024-03-30 14:08:14
python python-library speech vad speech-processing
Voxseg Voxseg是用于语音活动检测(VAD)的Python软件包,用于语音/非语音音频分段。 它提供了完整的VAD流水线,包括一个预训练的VAD模型,并且基于介绍的工作。 该VAD的使用可引述如下: @inproceedings{cnnbilstm_vad, title = {A hybrid {CNN-BiLSTM} voice activity detector}, author = {Wilkinson, N. and Niesler, T.}, booktitle = {Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)}, year = {2021}, address = {Toronto, Cana
【文件预览】:
voxseg-master
----voxseg()
--------models()
--------main.py(3KB)
--------prep_labels.py(5KB)
--------utils.py(7KB)
--------run_cnnlstm.py(9KB)
--------evaluate.py(6KB)
--------__init__.py(75B)
--------extract_feats.py(6KB)
----Dockerfile(328B)
----tests()
--------features()
--------test_example.py(1KB)
--------data()
--------ground_truth()
--------output()
--------__init__.py(0B)
--------wavs()
----LICENSE(1KB)
----requirements.txt(734B)
----setup.py(878B)
----.gitignore(7KB)
----README.md(6KB)
----.vscode()
--------settings.json(48B)