文件名称:Deep_Speaker-speaker_recognition_system:Keras实现``Deep Speaker
文件大小:439.9MB
文件格式:ZIP
更新时间:2024-03-31 10:19:15
系统开源
深度演讲者:演讲者识别系统 数据集: 参考文件:参考代码: : (感谢PhilippeRémy) 此代码在librispeech-train-clean数据集上进行了培训,并在librispeech-test-clean数据集上进行了测试。 在我的代码中,librispeech数据集显示CNN模型的EER约为5%。 关于守则 train.py 这是主文件,包含训练,评估和保存模型功能models.py 用于实验的神经网络。 该文件包含三个模型,CNN模型(与本文的CNN相同),GRU模型(与本文的GRU相同)和simple_cnn模型。 simple_cnn模型的性能与原始CNN模型相似,但是训练参数的数量从24M下降到7M。 select_batch.py 选择最佳的网络批处理供稿。 这是该实验的核心之一。 triplet_loss.py 这是用于计算网络训练的三重态损失的代码。