深度演讲者:深度演讲者:端到端神经演讲者嵌入系统

时间:2024-02-25 17:49:09
【文件属性】:

文件名称:深度演讲者:深度演讲者:端到端神经演讲者嵌入系统

文件大小:1.93MB

文件格式:ZIP

更新时间:2024-02-25 17:49:09

deep-learning tensorflow keras deep-speaker DeeplearningPython

深度演讲者:端到端神经演讲者嵌入系统。 深度演讲者的非官方Keras实现| 。 样品结果 对模型进行了干净语音数据的训练。 请记住,在嘈杂的数据上性能会降低。 型号名称 测试数据集 数字扬声器 F TPR 行政协调会 能源效率 训练记录 下载型号 ResCNN Softmax训练有素 全部(*) 2484 0.789 0.733 0.996 0.043 ResCNN Softmax + Triplet训练有素 全部(*) 2484 0.843 0.825 0.997 0.025 (*)全部包括:dev-clean,dev-other,test-clean,test-


【文件预览】:
deep-speaker-master
----constants.py(715B)
----triplet_loss.py(3KB)
----eval_metrics.py(3KB)
----deep-speaker(1KB)
----audio.py(5KB)
----utils.py(3KB)
----example.py(2KB)
----cli.py(4KB)
----test.py(3KB)
----.github()
--------FUNDING.yml(23B)
--------workflows()
----train.py(5KB)
----tests()
--------__init__.py(0B)
--------triplet_loss_test.py(2KB)
--------batcher_t1.py(3KB)
--------batcher_t2.py(1KB)
----tox.ini(177B)
----LICENSE(1KB)
----conv_models.py(7KB)
----samples()
--------1255-90413-0001.flac(118KB)
--------PhilippeRemy()
----requirements.txt(199B)
----.gitignore(1KB)
----download_librispeech.sh(935B)
----README.md(6KB)
----viz()
--------triplet_visualization.py(2KB)
----batcher.py(23KB)

网友评论