文件名称:Code-Mixed-Dialog
文件大小:16.34MB
文件格式:ZIP
更新时间:2024-05-31 18:12:45
seq2seq hred code-mixing Python
混合代码对话框 该存储库包含论文集和基线实现 面向目标的对话系统的需求在不断增长,它可以帮助用户进行各种日常活动,例如订票,餐厅预订,购物等。用于构建此类对话系统的大多数现有数据集都集中在单语对话和在多语言和/或代码混合对话中几乎没有任何工作。 因此,此类数据集和系统无法满足世界上多种语言的地区的需求,例如印度。在印度,人们说一种以上的语言并在它们之间进行无缝切换会导致混合代码的对话,这是非常普遍的。 例如,一个说预订餐厅的说印地语的用户通常会问: “ Kya tum是餐厅吗? (“您能帮我在这家餐厅预订餐桌吗?”。)为了促进此类代码混合对话模型的开发,我们构建了一个包含代码混合对话的面向目标的对话框数据集。 具体来说,我们从DSTC2餐厅预订数据集中获取文本,并以印地语-英语,孟加拉语-英语,古吉拉特语-英语和泰米尔语-英语创建其代码混合版本。 我们还使用现有的现有技术模型(例如序列到
【文件预览】:
Code-Mixed-Dialog-master
----data()
--------tamil()
--------english()
--------hindi()
--------bengali()
--------gujarati()
----code()
--------hred()
--------train_hred.py(11KB)
--------scores()
--------seq2seq()
--------train_seq2seq.py(13KB)
----LICENSE(11KB)
----README.md(6KB)