文件名称:axcell:从机器学习论文中提取表和结果的工具
文件大小:247KB
文件格式:ZIP
更新时间:2024-05-24 22:32:51
Python
AxCell:自动从机器学习论文中提取结果 该存储库是的正式实现。 要求 要创建一个指定的环境axcell及安装要求运行: conda env create -f environment.yml 此外, axcell需要docker (即可以在不运行sudo )。 运行scripts/pull_docker_images.sh下载必要的图像。 数据集 我们发布以下数据集: 有关如何加载下面提供的数据集的示例,请参见笔记本。 笔记本显示了如何使用axcell从文件中提取文本和表格。 评估 有关如何在PWCLeaderboards数据集上评估AxCell的完整示例,请参见笔记本。 训练 ArxivPapers数据集上的预训练语言模型 表类型分类器和SegmentedResults数据集上的表细分 预训练模型 您可以在此处下载预训练的模型: axcell —包含分类法,缩写,表类型分类
【文件预览】:
axcell-master
----MANIFEST.in(58B)
----notebooks()
--------results-extraction.ipynb(13KB)
--------datasets.ipynb(8KB)
--------evaluation.ipynb(12KB)
--------training()
--------extraction.ipynb(29KB)
----scripts()
--------pull_docker_images.sh(159B)
--------download_arxiv_s3_papers.sh(1KB)
----axcell()
--------config.py(956B)
--------models()
--------scripts()
--------errors.py(213B)
--------__init__.py(73B)
--------helpers()
--------loggers.py(8KB)
--------mocks()
--------data()
--------pipeline_logger.py(954B)
----pytest.ini(57B)
----LICENSE(11KB)
----environment.yml(950B)
----test()
--------.gitignore(6B)
----setup.py(2KB)
----README.md(4KB)
----docker-compose.yml(508B)
----tests()
--------test_metric_ranges.py(1KB)
--------test_extraction.py(1KB)
--------data()
----.gitignore(1KB)