文件名称:Latest on Arxiv:解析最新的 Arxiv RSS 流并获取您的机构预印本-开源
文件大小:42KB
文件格式:GZ
更新时间:2024-08-08 04:14:03
开源软件
最新的 Arxiv 是一个程序/脚本,可以做一个简单的工作。 每天,它都会从您最喜欢的 Arxiv RSS 下载所有 pdf 文件,然后扫描它以查看您最喜欢的机构是否有任何作者在那里。 如果是这样,它将保存结果索引。 然后将匹配的文件解析为一个简短列表,其中仅包含最新的 4 个预印本(这对于咖啡角的单个电视屏幕来说是理想的),以及一个以可点击方式包含每篇论文的长列表。 我提供这个软件作为我们在 Kapteyn 天文研究所如何做的演示。 该脚本每天作为 cron 命令运行。 您可以随意使用和修改此代码。 但是,如果您正在使用它,我很乐意至少从您这里了解我并没有白白提出这个问题。 该程序没有主要的先决条件,除了 Python 包 pyPdf。 它是为 Python 2.6.x 系列构建的,但可能也适用于许多其他版本。
【文件预览】:
database.txt
parse.py
.gitignore
README