文件名称:LICS2021_MRC:2021语言与智能技术竞赛:机器阅读理解任务
文件大小:1.54MB
文件格式:ZIP
更新时间:2024-05-07 21:10:45
mrc machine-reading-comprehension roberta-wwm-ext lics lics2021
LICS2021 MRC 1. 项目&任务介绍 本项目基于官方给定的baseline()进行二次改造,对整个代码框架做了简单的重构,对核心网络结构添加了注释,解耦了数据读取的模块,并添加了阈值确认的功能,一些小的细节也做了改进。 本次任务为:机器阅读理解任务,机器阅读理解 (Machine Reading Comprehension) 是指让机器阅读文本,然后回答和阅读内容相关的问题。 具体的,给定一个问题q,一段篇章p及其标题t,参赛系统需要根据篇章内容,判断该篇章p中是否包含给定问题的答案,如果是,则给出该问题的答案a;否则输出“无答案”。数据集中的每个样本,是一个四元组(q、p、t和a),例如: 问题 ( q ): 番石榴汁热量 篇章 ( p ): 番石榴性温,味甜、酸、涩…,最重要的是番石榴所含的脂肪热量较低,一个番石榴所含的脂肪约0.9克重或84卡路里。比起苹果,番石榴所含有的脂
【文件预览】:
LICS2021_MRC-master
----models()
--------loss_layer.py(1KB)
--------model_layer.py(5KB)
--------__init__.py(0B)
----bin()
--------run_train.sh(2KB)
--------run_eval.sh(1KB)
--------run_predict.sh(2KB)
--------check_eval.sh(2KB)
----confirm_cls_threshold.py(2KB)
----ernie10()
--------.gitkeep(0B)
----dataset()
--------dev.json(1.47MB)
--------small_test.json(12KB)
--------train.json(4.03MB)
--------small.json(12KB)
----evaluate.py(8KB)
----roberta_wwm_ext_large()
--------.gitkeep(0B)
----finetuned_model()
--------.gitkeep(0B)
----.gitignore(278B)
----README.md(15KB)
----utils()
--------data_helper.py(9KB)
--------input_args.py(4KB)
--------__init__.py(0B)
--------infer.py(10KB)
----roberta_wwm_ext()
--------.gitkeep(0B)
----run_mrc.py(11KB)