文件名称:blogspot-downloader:python blogspot下载器
文件大小:3.02MB
文件格式:ZIP
更新时间:2024-04-26 10:37:39
python blog rss pdf scraper
blogspot下载器 这个python脚本从blogspot下载所有帖子,然后转换为epub或pdf,可以是网页外观,也可以是rss feed外观。 不仅blogspot,如果任何网页包含rss feed,尤其是wordpress,则它可以rss模式下载。 为什么 ? 现有的在线服务要么需要付费,有文件限制,需要手动复制每页,仅支持rss feed或仅支持epub。 这个python脚本是免费的,没有文件限制,因为它在您的本地计算机/ ip中运行,自动下载所有页面/提要,同时支持rss和web抓取(某些博客rss是私有的或仅一页),同时支持epub和pdf。 它还支持自定义语言环境日期。 最重要的是:这是简单的python代码,您可以随意对其进行修改,例如,自定义html颜色,额外的html页眉/页脚,默认目录...等:) 如何设置(仅支持python3): git clone h
【文件预览】:
blogspot-downloader-master
----requirements_py3.txt(32B)
----images()
--------google.png(407KB)
--------perl.png(217KB)
--------medium.png(174KB)
--------locale.png(357KB)
--------eat.png(316KB)
--------color.png(128KB)
----deprecated()
--------python2()
----pypub()
--------epub_templates()
--------chapter.py(20KB)
--------unit_tests_chapter.py(2KB)
--------unit_tests_image.py(2KB)
--------__init__.py(480B)
--------epub.py(10KB)
--------unit_tests_clean.py(5KB)
--------unit_tests_epub.py(4KB)
--------clean.py(7KB)
--------constants.py(2KB)
--------profile_tests.py(532B)
----blogspot_downloader.py(39KB)
----README.md(6KB)