crowd-indic-transliteration-data:Xlit-Crowd

时间:2024-07-14 03:07:11
【文件属性】:

文件名称:crowd-indic-transliteration-data:Xlit-Crowd

文件大小:130KB

文件格式:ZIP

更新时间:2024-07-14 03:07:11

transliteration indian-language indian-languages

Xlit-Crowd:印地语-英语音译语料库 语料库包含印地语-英语的音译对。 这些对是通过众包获得的,要求工人将印地语单词音译为罗Maven字。 这些任务是在 Amazon Mechanical Turk 上完成的,总共产生了 14919 对。 有关数据集的详细信息在以下论文中提到。 如果您正在使用此数据集进行研究,请引用本文: Mitesh M. Khapra、Ananthakrishnan Ramanathan、Anoop Kunchukuttan、Karthik Visweswariah、Pushpak Bhattacharyya。 当音译遇到众包时:使用高效、非冗余和公平的质量控制通过众包进行音译的实证研究。 语言资源和评估会议(LREC 2014)。 2014 年。 执照 Xlit-Crowd: Mitesh Khapra 的印地语-英语音译语料库已根据。


【文件预览】:
crowd-indic-transliteration-data-master
----crowd_transliterations.hi-en.txt(371KB)
----README.md(1KB)

网友评论