文件名称:UberEats分析:UberEats Webscrapping +探索性数据分析
文件大小:2.69MB
文件格式:ZIP
更新时间:2024-03-01 07:41:22
JupyterNotebook
UberEats分析 目的 刮擦UberEats送餐平台并将结果与foodpanda进行比较 项目概况 从香港的天华地区刮掉了500多家餐厅。 清理数据进行分析 提供发现 项目总结 使用的代码和资源 Python版本: 3.9.1软件包: pandas,numpy,matplotlib,seaborn,selenium,bs4,requests,requests-futures,regex 队友: 和 网页抓取 从先前的Job抓取项目中复制并粘贴了一些代码。 从每个餐厅中提取以下信息: 名称 送货费 食物种类 评分 评论 菜单项 菜单价格 数据清理 由于餐厅有汉字,该文件必须使用UTF-8编码打开。 在使用数据之前,需要进行大量数据清理。 对于Name,我必须去除汉字并从字符串中删除(AREA) 运费-从字符串中提取整数 食物类型-使用正则表达式将美食提取到一个列表中,然后选
【文件预览】:
UberEats-Analysis-main
----01-futuresessions.ipynb(8KB)
----figures()
--------UberEatXPanda Price Difference.png(138KB)
--------dollarsignrating.png(876KB)
--------UberEatXPanda Delivery Difference.png(110KB)
--------Dollarsign_vs_AveragePrice.png(26KB)
--------ReviewCounts_Vs_Ratings.png(23KB)
--------DeliveryCostCounts.png(19KB)
--------cuisineCounts.png(64KB)
--------head.png(362KB)
----.gitattributes(66B)
----1-Cleaningubereats.ipynb(214KB)
----cleanedUber.csv(1.65MB)
----3-EDAonUberEats.ipynb(54KB)
----README.md(4KB)
----0-ScrapingUberEats.py(5KB)
----big_df_UBERXPANDA.csv(38KB)
----5-EDAonUBERXPANDA.ipynb(59KB)
----4-MergingDFs.ipynb(38KB)
----ubereats.csv(1.99MB)
----.gitignore(2KB)
----all_url.txt(72KB)