文件名称:arxiv-fulltext:arXiv纯文本提取
文件大小:16.77MB
文件格式:ZIP
更新时间:2024-05-22 13:45:47
arXiv纯文本提取 此服务从arXiv PDF提取纯文本。 在提交过程中将其用作常规质量保证检查的一部分。 公告后也可以使用它来更新质量保证工具(例如,重叠检测)并使纯文本内容可供授权的API使用者使用。 批量访问arXiv电子打印 请参阅,以获取有关如何批量访问arXiv电子印刷品的说明。 去做 使用工厂功能,而不是仅在模块中实例化Celery。 从Flask应用程序配置Celery应用程序(统一配置)。 。 快速开始 依存关系 我们使用来管理Python依赖项。 您可以像这样安装该项目的所有依赖项: pipenv install --dev 码头工人 最小的工作服务集群需要API应用程序,工作程序应用程序,Docker主机(例如,垃圾容器)和任务队列/结果后端的Redis。 使所有这些一起运行的最简单方法是在此存储库的根目录中使用docker-compose.yml配置。