advanced-web-scraping

时间:2024-07-11 02:13:34
【文件属性】:

文件名称:advanced-web-scraping

文件大小:8KB

文件格式:ZIP

更新时间:2024-07-11 02:13:34

Python

使用网络检查器进行复杂的刮擦 此存储库包含使用 NICAR 2015 高级网络抓取课程中教授的概念在 Ruby 和 Python 中进行抓取的示例脚本。 该课程侧重于使用网络检查器来查找进行更复杂的抓取所需的信息。 可以在找到演示文稿的幻灯片。 要求 ###Python Python 抓取只需要两个未包含在 Python 标准库中的模块。 是一个用于解析 HTML 和 XML 等 Markdown 语言的模块。 用于发出获取和发布 Web 请求。 两者都可以使用pip单独安装,也可以使用pip install -r requirements.txt一起pip install -r requirements.txt 。 ###Ruby Ruby 脚本需要三个不同的库。 第一个是 ,Ruby 的 HTML 和 XML 解析器。 ASP.NET 抓取需要来模拟浏览器。 在 mapscrape.


【文件预览】:
advanced-web-scraping-master
----.gitignore(16B)
----python()
--------requirements.txt(24B)
--------aspscrape.py(7KB)
--------mapscrape.py(1KB)
----ruby()
--------mapscrape.rb(1KB)
--------aspscrape.rb(2KB)
--------Gemfile(79B)
----readme.md(2KB)

网友评论