文件名称:neurips_crawler:获取所有NeurIPS论文
文件大小:8KB
文件格式:ZIP
更新时间:2024-03-03 16:34:15
Python
neurips_crawler 获取输入年份的所有NeurIPS论文。 该代码的灵感来自@benhamner的。 要使用此脚本,您应该首先设置一个虚拟环境,然后运行 pip install -r requirements.txt 然后,您可以运行下面的代码,从每年的from_year到to_year ,开始抓取每个NeurIPS会议的所有PDF。 输出将存储在./output (默认)文件夹中。 执行日志将存储在crawler_log.txt (默认)。 python src/neurips_crawler.py --from_year=1998 --to_year=2018 --output=./output/ --log=./crawler_log.txt 对于每个会议年度,该脚本将在--output内创建一个文件夹,所有文件将与jsons文件一起存储,并从网站收集每篇论文
【文件预览】:
neurips_crawler-master
----.gitignore(59B)
----requirements.txt(311B)
----src()
--------neurips_crawler.py(9KB)
----.python-version(6B)
----.isort.cfg(95B)
----LICENSE(1KB)
----.python-virtualenv(16B)
----README.md(3KB)
----.pylintrc(281B)
----.style.yapf(49B)
----mypy.ini(168B)