文件名称:CMRC2018原代码
文件大小:2.95MB
文件格式:ZIP
更新时间:2022-06-14 15:56:09
自然语言处理 nlp
A Span-Extraction Dataset for Chinese Machine Reading Comprehension一文对应的原代码。 机器阅读理解(Machine Reading Comprehension,MRC)是一种利用算法使计算 机理解文章语义并回答相关问题的技术。 抽取式阅读理解,即给定一个文章和一个问题,在文章中找到一个连续的片段作 为答案。 作者Github对应项目地址: https://github.com/ymcui/cmrc2018 https://github.com/ymcui/Chinese-BERT-wwm https://github.com/ymcui/PERT 模型来自哈工大讯飞联合实验室(HFL)
【文件预览】:
cmrc
----tokenization.py(12KB)
----runs()
--------.ipynb_checkpoints()
----train.sh(2KB)
----data()
--------cmrc2018_trial.json(781KB)
--------cmrc2018_train.json(7.07MB)
--------cmrc2018_dev.json(3.15MB)
--------.ipynb_checkpoints()
----train.py(48KB)
----ReadMe.md(521B)
----__pycache__()
--------optimization.cpython-36.pyc(4KB)
--------modeling.cpython-36.pyc(25KB)
--------tokenization.cpython-36.pyc(10KB)
----transfer_data.sh(1KB)
----evaluate.py(4KB)
----optimization.py(6KB)
----.ipynb_checkpoints()
--------train-checkpoint.py(48KB)
--------evaluate-checkpoint.py(4KB)
--------modeling-checkpoint.py(37KB)
--------transfer_data-checkpoint.sh(1KB)
--------train-checkpoint.sh(2KB)
--------optimization-checkpoint.py(6KB)
--------evaluate-checkpoint.sh(2KB)
----modeling.py(37KB)
----evaluate.sh(2KB)