文件名称:Flipkary_Product_Category_Prediction:根据描述预测产品类别
文件大小:46KB
文件格式:ZIP
更新时间:2024-04-30 17:35:01
Flipkary_Product_Category_Prediction 根据描述预测产品类别 关于: 该存储库的目的是根据描述预测产品类别。 此仓库中使用的数据取自Kaggle: ://www.kaggle.com/PromptCloudHQ/flipkart-products该数据集包含有关20000种产品的信息,具有描述,零售价,折扣价等特征。 涉及的步骤: 探索性数据分析 数据可视化(最常用词,最大注释长度) 预处理文本 模型构建(逻辑回归,朴素贝叶斯,随机森林,SVM) 测验 数据预处理: 最初,有一个产品类别树。 处理后,为所有行找出主要类别。 许多产品提到的类别都不属于主要类别之一。 经检查后,为此类产品分配了正确的类别。 预处理后,剩下18个主要类别。 由于数据集具有2个离群值,因此进行了平衡并获得了平衡数据集以进行进一步的工作。 数据预处理后: 文字预处理
【文件预览】:
Flipkary_Product_Category_Prediction-main
----images(1B)
----Screenshot 2021-04-10 at 8.34.31 PM.png(54KB)
----README.md(3KB)