文件名称:帮助AmazonReviewers:帮助Amazon产品评论员更有用地撰写
文件大小:5.24MB
文件格式:ZIP
更新时间:2024-03-10 01:44:35
JupyterNotebook
帮助亚马逊评论者撰写更有帮助的文章 作者:Elliot Macy 概述 像Amazon这样的在线零售商会向用户征求产品评论,并根据有用性对评论进行排名。 用户可以通过投票确定评论是否有用,由用户手动评估评论的有用性。 因此,新撰写的评论无法立即进行排名,如果用户不对其进行投票,则低流量的评论可能永远不会排名。 该项目询问亚马逊是否可以自动评估评论的帮助程度。 为了回答这个问题,我研究了使用机器学习方法(包括随机森林,XGBoost和支持向量机分类模型)的自动产品评论有用性预测。 任务定义 给定针对特定产品类别的一组评论,请根据评论的有用性对其进行分类,其有用性定义为该评论对所有产品类别的评论的有用率与无用率之比是高于还是低于中位数。 数据 Amazon维护着一个可,该数据库包含从1996年到2015年的二十年产品评论(按产品类别)。数据集包括评论文本以及元数据(星级,产品ID,评论日期,
【文件预览】:
HelpingAmazonReviewers-main
----.gitignore(2KB)
----images()
--------conf_mtrx.png(50KB)
--------importance.png(143KB)
--------corr_trgt.png(60KB)
--------helpful_freqdist.png(112KB)
--------christian-wiediger-rymh7EZPqRs-unsplash.jpg(98KB)
--------PCA_tSNE.png(437KB)
--------corr_mtrx.png(65KB)
--------density.png(148KB)
--------roc_curve.png(99KB)
----eda.ipynb(1.09MB)
----pickles()
--------svm_grid.pickle(7.55MB)
--------xgb_grid.pickle(130KB)
--------rf_grid.pickle(466KB)
----modelling.ipynb(410KB)
----data_processing.ipynb(25KB)
----README.md(4KB)
----Presentation.pdf(931KB)