git-pull:Github的并行网络刮板

时间:2024-02-25 00:56:24
【文件属性】:

文件名称:git-pull:Github的并行网络刮板

文件大小:7.66MB

文件格式:ZIP

更新时间:2024-02-25 00:56:24

github github-api scraper parallel web-scraper

git-pull git-pull是Github的网页抓取工具。 从Github上的个人资料,回购,或文件数据-如果你愿意,或者,拉-你可以用它来刮。 它是并行化的,并且为想要避免使用Github API(例如,由于速率限制)的任何人而设计。 使用它非常简单: from git_pull import GithubProfile gh = GithubProfile ( "sho*" ) gh . scrape_follower_count () # >>> 168 请注意, git-pull并不是Github API的完美替代。 还有一些尚无法解决的问题,例如回购的提交历史或发


【文件预览】:
git-pull-main
----MANIFEST.in(29B)
----LICENSE(1KB)
----setup.py(843B)
----.gitignore(2KB)
----README.md(6KB)
----git_pull()
--------utilities.py(6KB)
--------resources()
--------__init__.py(48B)
--------git_pull.py(10KB)
--------exceptions.py(217B)

网友评论