文件名称:OCNLI:欧尼
文件大小:4.15MB
文件格式:ZIP
更新时间:2024-03-28 13:25:23
Python
OCNLI:原始中国自然语言推论 OCNLI代表原始中国自然语言推论。 它是中文自然语言推理的语料库,它是按照的程序紧密收集的,但具有旨在针对更具挑战性的推理对的增强策略。 我们要强调的是,我们在创建数据集时没有使用人机翻译,因此我们的中文文本是原始的,未经翻译。 OCNLI大约有五万对训练用,三千个用于开发,三千个用于测试。 我们仅发布测试数据,但不发布其标签。 有关详细信息,请参见我们的。 OCNLI是基准测试的一部分。 OCNLI,即原生中文自然语言推理数据集,是第一个非翻译的,使用原生汉语的大型中文自然语言推理数据集。OCNLI包含5万余训练数据,3千验证数据及3千测试数据。除测试数据外,我们将提供数据及标签。测试数据仅提供数据。OCNLI为中文语言理解基准测评( )的一部分。更多细节请参考我们的。 数据格式 我们的数据集以json格式分发。 这是来自OCNLI.dev的示
【文件预览】:
OCNLI-main
----requirements-docker.txt(14B)
----Dockerfile(253B)
----requirements.txt(66B)
----README.md(11KB)
----rep_baseline.md(5KB)
----data()
--------ocnli()
----ocnli()
--------bert()
--------classifier_utils.py(33KB)
--------__main__.py(0B)
--------mnli_code()
--------roberta_wwm_large_ext()