Amazon_vine_analysis

时间:2021-03-31 10:29:16
【文件属性】:
文件名称:Amazon_vine_analysis
文件大小:7KB
文件格式:ZIP
更新时间:2021-03-31 10:29:16
JupyterNotebook Amazon_vine_Analysis 该项目分析了Amazon Vine计划,并确定是否存在偏向Vine成员好评的偏见。 该分析使用PySpark执行ETL过程以提取数据集,转换数据,连接到AWS RDS实例,将转换后的数据加载到pgAdmin中并计算不同的指标。 我们专注于美国对厨房用品的评论。 资源 来自Amazon评论Google Colab Notebook Jupyter Notebook Pysparks pg Admin postgres AWS控制台-RDS 目的 我选择分析Amazon评论中的Kitchen项目评论。使用PySpark到我执行ETL过程以提取数据集,转换数据,连接到AWS RDS实例并将转换后的数据加载到pgAdmin中。 我使用Panda来确定我的数据集中的Vine成员是否对偏爱的评论有任何偏见。 结果 那里有多少个Vine评论和非Vine评论?
【文件预览】:
Amazon_vine_analysis-main
----README.md(1KB)
----Amazon_Reviews_ETL.ipynb(24KB)

网友评论