文件名称:newscatcher:以编程方式从(几乎)任何网站收集标准化新闻
文件大小:825KB
文件格式:ZIP
更新时间:2024-03-20 00:29:55
Python
时事通讯 以编程方式从(几乎)任何网站收集标准化新闻。 按主题,国家或语言过滤。 由创建,但是您不需要我们或任何其他人来获得该软件的支持,它可以直接使用。 演示版 动机 在处理用于查询新闻文章的JSON API时,我想到了一个简单的Python程序包,可以轻松获取实时新闻数据的想法。 当我以前是初级数据科学家从事我自己的副项目时,我很难使用外部数据源。 我非常了解Python,但是在大多数情况下,这还不足以建立需要自己收集数据的适当数据管道。 我希望这个软件包能为您的下一个项目提供帮助。 即使我不建议将此软件包用于任何生产系统,但我相信它足以测试您的假设并建立一些MVP。 安装 pip install newscatcher --upgrade 快速开始 from newscatcher import Newscatcher 从获取最新新闻(我们支持数千个新闻网站,请尝试一下!
【文件预览】:
newscatcher-master
----poetry.lock(12KB)
----.gitignore(2KB)
----newscatcher_oneliner.png(100KB)
----requirements.txt(31B)
----pyproject.toml(604B)
----dist()
--------newscatcher-0.1.0-py3-none-any.whl(98KB)
--------newscatcher-0.1.0.tar.gz(99KB)
----LICENSE(1KB)
----README.md(6KB)
----tests()
--------__init__.py(0B)
--------test_newscatcher.py(92B)
----newscatcher()
--------data()
--------__init__.py(8KB)
----newscatcherdemo.gif(418KB)