文件名称:hacker-news-digest:带有摘要和缩略图的Hacker News响应界面
文件大小:1.16MB
文件格式:ZIP
更新时间:2024-02-24 13:18:47
python html rss content crawler
该服务从文章中提取摘要和插图,供那些想充分利用的人使用,同时减少了在决定阅读哪个和跳过哪个方面时所花的时间。 另请参阅有关指南。 产品特点 灵敏的现代界面非常适合手机 摘要和图像使文章可扫描 普通视频站点,PDF和github要点直接嵌入 还显示了子域及其可爱的图标 按分数/评论/时间对文章进行排序 RSS feed可以按分数和关键字进行自定义 谈话很便宜,说明对我有什么用! 去做 删除网站的更好方法(也许是PhantomJS和Selenium) 一个更漂亮的主页(也许在HTML9中) 提取摘要的更好算法 按分数/评论/时间对文章进行排序 的RSS 睡个好觉!重要 执照 中文版的
【文件预览】:
hacker-news-digest-master
----runtime.txt(14B)
----Dockerfile(734B)
----.gitignore(584B)
----README.md(2KB)
----config.py(1KB)
----models.py(6KB)
----test()
--------test_hackernews_parser.py(955B)
--------test_pdf_parser.py(808B)
--------README.md(297B)
--------test_html_parser.py(15KB)
--------fixtures()
--------test_embeddable_parser.py(5KB)
--------test_utils.py(637B)
--------__init__.py(141B)
--------test_database.py(1KB)
--------test_image.py(1KB)
----Procfile(24B)
----static()
--------css()
--------sitemap.xml(515B)
--------fonts()
--------qr_zhifubao.png(94KB)
--------apple-touch-icon.png(2KB)
--------spinner.gif(112KB)
--------js()
--------ads.txt(58B)
--------favicon.ico(15KB)
----[tutorial] How-to-extract-main-content-from-web-pages-using-Machine-Learning.ipynb(43KB)
----.buildpacks(102B)
----index.py(5KB)
----hackernews.py(6KB)
----page_content_extractor()
--------README.md(835B)
--------exceptions.py(38B)
--------utils.py(3KB)
--------__init__.py(2KB)
--------embeddable.py(5KB)
--------html.py(14KB)
--------pdf.py(3KB)
--------webimage.py(4KB)
--------imgsz.py(13KB)
----config()
--------nginx.conf.erb(2KB)
--------blueware.ini(8KB)
--------newrelic.ini(9KB)
----requirements.txt(305B)
----LICENSE-lgpl-3.0.txt(7KB)
----startupnews.py(563B)
----.travis.yml(154B)
----templates()
--------startupnews.html(1KB)
--------hackernews.html(1KB)
--------base.html(11KB)
----Makefile(1KB)