文件名称:cmrc2018:中文机器阅读理解的跨度提取数据集(CMRC 2018)
文件大小:6.21MB
文件格式:ZIP
更新时间:2024-05-22 13:10:51
natural-language-processing question-answering reading-comprehension bert Python
| 该存储库包含。 我们将在上论文。 标题:中文机器阅读理解的跨度提取数据集作者:崔一鸣,刘婷,车万祥,李莉,陈志鹏,Maven涛,王世进,胡国平链接: : 地点:EMNLP-IJCNLP 2019 公开挑战排行榜(新!) 在CMRC 2018数据集上跟踪最新的最新系统。 CMRC 2018公开数据集 请通过以下CodaLab工作表下载CMRC 2018公开数据集。 提交准则 如果您想在隐藏的测试和挑战集上测试模型,请按照有关如何通过CodaLab工作表提交模型的说明进行操作。 **请注意, 上的测试集不是完整的测试集。 如果您希望在CMRC 2018上正式评估模型,则应遵循此处的指南。 ** 快速加载 :hugging_face: 资料集 您还可以作为HuggingFace datasets库库的一部分访问此数据datasets ,如下所示: !p ip install datasets f
【文件预览】:
cmrc2018-master
----sponsor.png(167KB)
----baseline()
--------tokenization.py(12KB)
--------modeling.py(37KB)
--------__init__.py(616B)
--------optimization.py(6KB)
--------run_cmrc2018_drcd_baseline.py(48KB)
--------README.md(4KB)
--------cmrc2018_evaluate.py(4KB)
----qrcode.jpg(26KB)
----README_CN.md(3KB)
----LICENCE(20KB)
----README.md(3KB)
----banner.png(131KB)
----data()
--------cmrc2018_train.json(9.04MB)
--------cmrc2018_trial.json(1.01MB)
--------cmrc2018_evaluate.py(4KB)
--------cmrc2018_dev.json(3.38MB)
----squad-style-data()
--------cmrc2018_train.json(7.07MB)
--------cmrc2018_trial.json(781KB)
--------cmrc2018_evaluate.py(4KB)
--------cmrc2018_dev.json(3.15MB)
----.gitignore(22B)