文件名称:webscrapper:Python +美丽汤中的简单webscrapper
文件大小:1.32MB
文件格式:ZIP
更新时间:2024-03-13 05:42:28
HTML
Webscrapper Python +美丽汤中的简单webscrapper 此存储库的目的是了解有关Web爬网的更多信息。 如上所述,我将Python和BeautifulSoup用于此任务。 我找到了一些有用的资源来测试和了解有关webscrapping的更多信息,所以它们是: 我决定抓取数据的页面是有关波兰国王的波兰*页面。 我使用python脚本将其保存在文件夹中,该脚本抓取了页面并将其写入.csv文件。 从我学到的知识,我可以说BSoup是一个非常不错的工具,它可以分解html标记并对其进行深入挖掘以获得数据。 对于任何新手,我建议您学习一些有关html标记的知识,因为在执行此任务之前阅读wiki页面的html标记对于我了解特定元素在何处以及应该使用html元素过滤的类名足够有用。获取我想要的数据。