文件名称:Exsell:TripAdvisor抓取
文件大小:1.87MB
文件格式:ZIP
更新时间:2024-05-02 08:03:52
Python
TripAdvisor_scraper烧瓶应用程序 一个简单的TripAdvisor刮瓶烧瓶应用程序,它将帮助您刮擦有关荷兰餐馆的所有详细信息。 详细信息包括名称,位置,等级,评论编号,菜式,餐厅网站,电子邮件,电话号码等。 用于抓取的软件包是BeautifulSoup和Selenium 。 Selenium用于刮擦餐厅的网站和电子邮件信息,BeauitfulSoup用于刮擦其余的细节。 然后,借助Flask软件包将代码包装到应用程序中。 创建应用程序后,将在Docker的帮助下将其容器化,部署在Kubernetes集群上,并借助Kubernetes外部IP地址将其暴露给外界。 运行该应用程序时,它将显示一个简单的欢迎页面,其中包含有关如何抓取的说明。 例如:当您输入“ / scrape / Amsterdam / 2”(语法-“ URL / scrape // <页数>”)时,应用程序
【文件预览】:
Exsell-master
----Scraper_flask_app.py(10KB)
----citylinks.csv(169KB)
----Netherlands()
--------extracting_All_citylinks.py(1KB)
--------Restaurant_TripAdvisor_Netherlands.csv(7.82MB)
--------citylinks.csv(173KB)
--------README.md(840B)
--------TripAdvisor_v2.py(9KB)
----README.md(1KB)
----AmsterdamRestaurants()
--------res_links_v1.csv(614KB)
--------res_links_v1_5.csv(78KB)
--------restaurant_TripAdvisor_Amsterdam.csv(2.3MB)
--------res_links_v1_1.csv(77KB)
--------res_links_v1_7.csv(75KB)
--------res_links_v1_2.csv(77KB)
--------README.md(632B)
--------res_links_v1_3.csv(78KB)
--------res_links_v1_0.csv(77KB)
--------res_links_v1_6.csv(77KB)
--------res_links_v1_4.csv(77KB)
--------TripAdvisorScraping.py(10KB)
----image()
--------5.PNG(62KB)