文件名称:top-github-scraper:基于关键字的*GitHub存储库和用户
文件大小:294KB
文件格式:ZIP
更新时间:2024-03-26 12:08:00
github python github-api scraping web-scraper
*Github铲运机
根据关键字抓取*Github存储库和用户。
我用这个工具来分析顶部1K机器学习的用户在。
设置
安装
pip install top-github-scraper
添加凭据
为了确保您可以抓取许多存储库和用户,请将GitHub的凭据添加到.env文件。
touch .env
将您的用户名和添加到.env文件:
GITHUB_USERNAME=yourusername
GITHUB_TOKEN=yourtoken
用法
获取*Github存储库的URL
from top_github_scraper import get_top_repo_urls
get_top_repo_urls ( keyword = "machine learning" , stop_page = 10 )
在top_repo_urls_
【文件预览】:
top-github-scraper-master
----.flake8(118B)
----.gitignore(101B)
----README.md(13KB)
----.pre-commit-config.yaml(309B)
----tests()
--------test_utils.py(1KB)
----example.py(302B)
----top_github_scraper()
--------scrape_user.py(3KB)
--------utils.py(5KB)
--------__init__.py(137B)
--------scrape_repo.py(10KB)
----figures()
--------contribution_graph.png(20KB)
--------first_13_data_points.png(29KB)
--------machine_learning_results.png(147KB)
--------demo.gif(39KB)
--------user_profile.png(35KB)
----pyproject.toml(1KB)
----.isort.cfg(164B)
----poetry.lock(55KB)