文件名称:sota-extractor:SOTA提取器管道
文件大小:113.46MB
文件格式:ZIP
更新时间:2024-05-27 09:23:20
Python
自动SOTA(最新技术)提取 汇总在免费许可证下共享的公共SOTA表。 下载已收集的数据或自己运行收集器以获取最新数据。 将来,我们计划自动化从论文中提取任务,数据集和结果的过程。 获取数据 数据保存在目录中。 所有数据均根据许可证共享。 数据已解析为一致的JSON格式,如下所述。 JSON格式说明 该格式包含五种主要数据类型: Task , Dataset , Sota , SotaRow和Link 。 有效的JSON文件是Task对象的列表。 您可以在文件夹中查看示例。 Task Task包含以下字段: task名称(字符串) description任务的简短描述,以markdown(字符串)表示 subtasks -零个或多个此任务子级的Task对象的列表(列表) datasets -在其上评估任务的零个或多个Dataset对象的列表(列表) source_link
【文件预览】:
sota-extractor-master
----setup.py(1KB)
----.gitignore(202B)
----requirements.txt(95B)
----Makefile(924B)
----data()
--------arxiv_metadata.json.gz(46.14MB)
--------eval_all_report.csv(2KB)
--------arxiv_aclweb.json.gz(67.13MB)
--------tasks()
----__init__.py(0B)
----MANIFEST.in(14B)
----.pre-commit-config.yaml(976B)
----LICENSE(11KB)
----setup.cfg(186B)
----README.md(5KB)
----sota_extractor()
--------errors.py(1KB)
--------taskdb()
--------consts.py(7KB)
--------__init__.py(0B)
--------scrapers()
--------tests()
--------__main__.py(79B)
--------commands()
--------serialization.py(2KB)
----requirements-dev.txt(195B)