文件名称:ClovaCall:ClovaCall数据集和Pytorch LAS基线代码(Interspeech 2020)
文件大小:27KB
文件格式:ZIP
更新时间:2024-05-03 16:56:12
speech-recognition speech-corpus korean-speech call-based-speech-corpus goal-oriented-dialog
ClovaCall:韩国目标导向对话语音语料库,用于呼叫中心的自动语音识别(Interspeech 2020) 1 *, 1,2 *,1,1,1, 1,Eunmi金1, Hyeji金1,Soojin金1,炫阿金1, 1,陈圭利1,1,SUNGHUN金1,3 1 NAVER公司的Clova AI, 2韩国外国语大学 3香港科技大学 *两位作者同样为这项工作做出了贡献。 通过呼叫进行自动语音识别(ASR)对于包括联系中心(CCAI)服务的AI在内的各种应用来说都是必不可少的。 尽管ASR有所发展,但是,大多数公开可用的呼叫语音语料库都是老式的,例如Swichboard。 而且,大多数呼叫语料库都是英语的,并且主要集中在开放领域的场景,例如有声读物。 在这里,我们介绍了一种新的大规模的基于韩国人的语音语料库,该语言语料库是面向目标的对话场景,来自11,000多人,即Clova Call语料
【文件预览】:
ClovaCall-master
----NOTICE(3KB)
----las.pytorch()
--------models()
--------label_loader.py(1KB)
--------main.py(14KB)
--------data_loader.py(5KB)
----data()
--------kor_syllable.json(16KB)
----LICENSE(1KB)
----README.md(12KB)
----script()
--------run_las_asr_decode.sh(2KB)
--------run_las_asr_trainer.sh(2KB)