文件名称:voxceleb_trainer:捍卫度量学习以实现说话人识别
文件大小:36KB
文件格式:ZIP
更新时间:2024-04-08 23:21:09
metric-learning speaker-recognition speaker-verification voxceleb Python
VoxCeleb教练 该存储库包含用于培训演讲者识别模型的框架,该文章在“捍卫说话者识别的度量学习”一文中进行了描述。 依存关系 pip install -r requirements.txt 资料准备 以下脚本可用于下载和准备VoxCeleb数据集以进行培训。 python ./dataprep.py --save_path data --download --user USERNAME --password PASSWORD python ./dataprep.py --save_path data --extract python ./dataprep.py --save_path data --convert 为了使用数据扩充,还运行: python ./dataprep.py --save_path data --augment 除Python依赖项外,必须在系统上安装wg
【文件预览】:
voxceleb_trainer-master
----NOTICE.md(5KB)
----loss()
--------angleproto.py(1KB)
--------softmax.py(633B)
--------amsoftmax.py(2KB)
--------softmaxproto.py(722B)
--------triplet.py(3KB)
--------ge2e.py(2KB)
--------aamsoftmax.py(2KB)
--------proto.py(1KB)
----models()
--------ResNetSE34Half.py(307B)
--------ResNetSE34V2.py(4KB)
--------VGGVox.py(3KB)
--------ResNetSE34L.py(5KB)
--------ResNetBlocks.py(3KB)
----utils.py(1KB)
----SpeakerNet.py(8KB)
----requirements.txt(68B)
----tuneThreshold.py(3KB)
----lists()
--------augment.txt(166B)
--------files.txt(140B)
--------fileparts.txt(1KB)
----References.md(4KB)
----scheduler()
--------steplr.py(315B)
----LICENSE.md(1KB)
----README.md(7KB)
----DatasetLoader.py(8KB)
----trainSpeakerNet.py(10KB)
----.gitignore(1KB)
----dataprep.py(6KB)
----optimizer()
--------adam.py(230B)
--------sgd.py(242B)