文件名称:ClariQ:克拉里克
文件大小:176.61MB
文件格式:ZIP
更新时间:2024-03-28 22:31:30
JupyterNotebook
克拉里克 介绍 ClariQ挑战作为2020年面向搜索的对话式AI(SCAI)EMNLP研讨会的一部分而组织。对话系统的主要目的是响应用户的要求返回适当的答案。 但是,某些用户请求可能不明确。 在信息检索(IR)设置中,这种情况主要是通过搜索结果页面的多样化来解决的。 但是,在对话设置中更具挑战性。 因此,我们旨在研究以下对话设置情况: 用户正在问一个模棱两可的问题(其中模棱两可的问题是一个可以返回> 1个可能答案的问题); 系统必须确定该问题是模棱两可的,而不是试图直接回答,而是要提出一个很好的澄清问题。 作为挑战的一部分,我们旨在回答的主要研究问题如下: RQ1:对话期间什么时候要提出澄清的问题? RQ2:如何产生澄清性问题? 挑战设计 ClariQ挑战分为两个阶段。 在阶段1(如下所述)中,为参与者提供主要由初始用户请求,澄清问题和用户答案组成的静态数据集,该数据集适用于初
【文件预览】:
ClariQ-master
----.gitignore(321B)
----data()
--------top10k_docs_dict.pkl.tar.gz(21.65MB)
--------dev.tsv(572KB)
--------dev_synthetic.pkl.tar.gz(7.03MB)
--------single_turn_train_eval.pkl(8.13MB)
--------test.tsv(2KB)
--------train.tsv(2.24MB)
--------question_bank.tsv(233KB)
--------train.qrel(4.07MB)
--------dev.qrel(1.22MB)
--------multi_turn_train_eval.pkl.tar.gz.ab(14.4MB)
--------multi_turn_train_eval.pkl.tar.gz.aa(100MB)
--------train_synthetic.pkl.tar.gz(29.14MB)
--------multi_turn_dev_eval.pkl.tar.gz(27.84MB)
----src()
--------clariq_baseine_bm25_multi_turn.ipynb(6KB)
--------clariq_baseline_bert_based.ipynb(93KB)
--------clariq_baseline_bm25_multi_turn.ipynb(6KB)
--------clariq_baseline_bm25.ipynb(6KB)
--------clariq_eval_tool.py(13KB)
--------clariq_baseine_bm25.ipynb(6KB)
----README.md(32KB)
----sample_runs()
--------dev_bm25.eval(30KB)
--------dev_best_q(2KB)
--------dev_BERT-reranker(47KB)
--------test_BERT-reranker(58KB)
--------dev_worst_q(2KB)
--------dev_bm25_multi_turn(1.21MB)
--------dev_worst_q.eval(28KB)
--------dev_no_q(1KB)
--------dev_best_q.eval(31KB)
--------dev_bm25(34KB)
--------dev_bm25_question_relevance.eval(5KB)
--------dev_no_q.eval(30KB)
--------dev_best_question_multi_turn(1.19MB)
--------dev_BERT-ranker(44KB)
--------test_BERT-ranker(54KB)
--------test_no_q(2KB)