【文件属性】:
文件名称:深度演讲者:深度演讲者:端到端神经演讲者嵌入系统
文件大小:1.93MB
文件格式:ZIP
更新时间:2021-02-05 00:02:29
deep-learning tensorflow keras deep-speaker DeeplearningPython
深度演讲者:端到端神经演讲者嵌入系统。
深度演讲者的非官方Keras实现| 。
样品结果
对模型进行了干净语音数据的训练。 请记住,在嘈杂的数据上性能会降低。
型号名称
测试数据集
数字扬声器
F
TPR
行政协调会
能源效率
训练记录
下载型号
ResCNN Softmax训练有素
全部(*)
2484
0.789
0.733
0.996
0.043
ResCNN Softmax + Triplet训练有素
全部(*)
2484
0.843
0.825
0.997
0.025
(*)全部包括:dev-clean,dev-other,test-clean,test-
【文件预览】:
deep-speaker-master
----constants.py(715B)
----triplet_loss.py(3KB)
----eval_metrics.py(3KB)
----deep-speaker(1KB)
----audio.py(5KB)
----utils.py(3KB)
----example.py(2KB)
----cli.py(4KB)
----test.py(3KB)
----.github()
--------FUNDING.yml(23B)
--------workflows()
----train.py(5KB)
----tests()
--------__init__.py(0B)
--------triplet_loss_test.py(2KB)
--------batcher_t1.py(3KB)
--------batcher_t2.py(1KB)
----tox.ini(177B)
----LICENSE(1KB)
----conv_models.py(7KB)
----samples()
--------1255-90413-0001.flac(118KB)
--------PhilippeRemy()
----requirements.txt(199B)
----.gitignore(1KB)
----download_librispeech.sh(935B)
----README.md(6KB)
----viz()
--------triplet_visualization.py(2KB)
----batcher.py(23KB)