Product_review:Shopee代码联盟

时间:2024-04-22 20:26:48
【文件属性】:

文件名称:Product_review:Shopee代码联盟

文件大小:6.98MB

文件格式:ZIP

更新时间:2024-04-22 20:26:48

HTML

数据科学预测用户评分(1-5) 通过给定的产品评论来预测用户评分。 浏览了约150000条产品评论。 处理的文本:对文本进行词形化处理,删除特殊字符,删除sxtra空格,删除停用词。 通过使用Binary分类模型(Logistic回归,SVM)和神经网络(DNN,LSTM,带有单词embeddubg的LSTM)对系统进行了优化。 使用的代码和资源 的Python版本: 3.7 包裹: pandas,numpy,spacy,nltk,sklearn,keras 问题陈述和数据: : 文本预处理参考: : 模型参考: : 文字预处理 做文本预处理: 删除重音符号 扩大收缩 小写文字 删除多余的换行符 在特殊字符之间插入空格以将其隔离 使文本合法化 删除特殊字符 删除停用词 标记化 建筑模型 我尝试了五个不同的模型,并使用准确性和混淆矩阵对其进行了评估:将数据从简单模型拟合到复杂


【文件预览】:
Product_review-master
----Product_reviews.html(514KB)
----dmm_model.png(32KB)
----contractions.py(3KB)
----Product_reviews.ipynb(190KB)
----model_evaluation_utils.py(9KB)
----_DS_Sentiment_Analysis.zip(6.64MB)
----README.md(2KB)
----lstm_model.png(32KB)
----lstm_em_model.png(37KB)

网友评论