文件名称:MuTual:多轮对话推理的数据集
文件大小:10.49MB
文件格式:ZIP
更新时间:2024-04-08 14:10:13
chatbot dataset Python
相互的 (ACL2020) MuTual是用于多回合对话推理的基于检索的数据集,该数据集是从中文高中英语听力理解测试数据中修改而来的。请参阅我们的论文以获取更多详细信息。 我们还提供了一些基准,以促进进一步的研究。 (快来了) 例子 修改听力理解测试数据的过程。 MuTual数据集中的示例。所有选择都与上下文相关,但是只有其中一项是逻辑正确的。在极端情况下,某些负面选择可能是合理的,但正面选择最合适。提示词为紫色且带有下划线。 数据统计 相互的 上下文响应对 8,860 #Avg。每次对话的轮流 4.73 #Avg。话语数 19.57 词汇量(上下文) 8,809 词汇量(响应) 8,943 词汇量 11,343 #原始对话 6,371 #原始问题 11,323 #响应候选人 4 资料范本 data/mutual/train , data/mutual/dev和dat