文件名称:rss_catalog:以机器可读的方式组织的文章的RSS feed的集合
文件大小:20KB
文件格式:ZIP
更新时间:2024-06-08 13:08:28
Python
RSS目录 RSS目录是以机器可读的方式组织的文章的RSS feed的集合。 为了有意义地组织文章,我们必须以某种方式对其进行描述。 这个项目力求做到客观(大约与Wikipedia一样客观)。 最好有一个描述一定是真实的,而不是根本没有描述。 例如,将《纽约时报》描述为美国的中心地带比争论什么应该算作美国的中心地带更有用。 这个收藏中有什么? 这里有很多粘性的定义,因此在某些时候,我们需要退回到“良好的判断力”。 文章 有效的文章是一个HTML页面,您将其描述为“文章”。 它应该具有1000个或更多的content的非空白字符。 这不包括广告,导航栏,隐藏的文字和其他无关紧要的内容。 文章的内容应该是文字。 主要包含图片,视频或其他多媒体内容的页面不是文章。 RSS订阅 有效的RSS是其中> = 50%的项目是有效文章的RSS。 项目结构 每个子目录都包含一个与该子目录有关的自述文件。
【文件预览】:
rss_catalog-master
----build()
--------source_list.json(28KB)
--------source_tree.json(9KB)
----README.md(1KB)
----resources()
--------source_list.json(28KB)
--------source_tree.json(9KB)
----python()
--------rss_catalog()
--------requirements.txt(89B)
--------tox.ini(57B)
--------setup.py(909B)
--------README.md(159B)
--------.gitignore(730B)
--------bin()