文件名称:gotham-grabber
文件大小:12KB
文件格式:ZIP
更新时间:2024-06-15 11:03:34
Python
哥tanh抢夺者 gotham-grabber是一组最初编写的脚本,用于获取Gothamist / DNAinfo网络中某个站点上作家页面的URL,并生成每篇文章的精美PDF集合。 它是在网站于2017年11月2日突然关闭之后创建的。前LAist的主编,Gothamist网络中的网站之一,已经。 自项目开始以来,脚本已扩展为支持来自以下新闻站点的作者页面: 哥tanh(以及-ist网络中的其他站点) DNA信息 洛杉矶周刊 新闻周刊 金佳 外部Python脚本gothamgrabber.py以带有--url标志的作者页面URL作为参数,在运行它的out子文件夹中创建目录,并保存文章URL列表。 (如果该URL列表已经存在,则gotham-grabber.py可以使用-t或--textfile选项将其作为输入。)然后,它调用一个驱动无头Chrome实例进行捕获和捕获的节点脚本grabb
【文件预览】:
gotham-grabber-main
----gothamgrabber.py(7KB)
----grabber.js(3KB)
----package.json(616B)
----LICENSE(1KB)
----package-lock.json(12KB)
----tweaks()
--------dnainfo.css(97B)
--------thetoast.css(67B)
--------newsweek.css(422B)
--------laweekly.css(84B)
--------kinja.css(585B)
----requirements.txt(111B)
----.gitignore(35B)
----README.md(1KB)