speech_yolo:演讲YOLO Interspeech 2019

时间:2024-06-14 22:37:36
【文件属性】:

文件名称:speech_yolo:演讲YOLO Interspeech 2019

文件大小:94.63MB

文件格式:ZIP

更新时间:2024-06-14 22:37:36

Python

SpeechYOLO:语音对象的检测和本地化 Yael Segal( ) 齐维娅·西尔维亚·福克斯( Sylvia Fuchs)( ) 约瑟夫·克谢(Joseph Keshet)( ) 受算法启发,SpeechYOLO使用视觉领域的对象检测方法进行语音识别。 SpeechYOLO的目标是在输入信号中定位发声的边界,并对其进行正确分类。 我们的系统由卷积神经网络组成,具有简单的最小均方损失函数。 该文件可以在找到。 如果您发现我们的工作有用,请引用: @article{segal2019speechyolo, title={SpeechYOLO: Detection and Localization of Speech Objects}, author={Segal, Yael and Fuchs, Tzeviya Sylvia and Keshet, Joseph}


网友评论