文件名称:使用Selenium和bs4的中等博客文章的Web废弃
文件大小:4.64MB
文件格式:ZIP
更新时间:2024-03-08 01:48:49
Python
使用Selenium和bs4的中型博客文章的Web剪贴 该网络抓取工具主要从事收集数据的工作,以分析中型博客文章的作者和读者档案。 我计划利用潜在狄利克雷分配(LDA)和网格搜索来实施某种主题分析,以查找作家正在发布的热门主题 :grinning_face_with_smiling_eyes: 依存关系: Selenium 美丽的汤4 大熊猫 要求 使用以下命令安装软件包: pip install <软件包名称> 您还需要在系统中安装chromedriver。 您可以在此存储库中找到适用于Win10的最新Chromedriver。 否则,您可以检查以获取操作系统的chromdriver。
【文件预览】:
-Web-Scrapping-of-Medium-blogposts-using-Selenium-and-bs4-master
----chromedriver.exe(8.62MB)
----LICENSE(11KB)
----README.md(711B)
----web_scraping_articles.py(10KB)