文件名称:Multi-label-classification:该项目旨在通过使用“产品描述”作为主要输入功能来预测产品类别
文件大小:705KB
文件格式:ZIP
更新时间:2024-05-07 19:15:30
nlp classifier machine-learning machine naive-bayes-classifier
产品分类-多标签分类 数据集-https: usp 数据集由20,000行和15列组成。 该项目的目的是借助其描述来识别产品类别。 因此,我们以产品说明为主要特征,以类别为目标。 我们将使用以下算法来执行此分类任务: 多项式朴素贝叶斯 逻辑回归 随机梯度下降(SGD) 支持向量机 我们正在使用Jupyter Notebook进行编码。 我们将要使用的库如下: 大熊猫 Scikit学习 正则表达式 Matplotlib NLTK 资源/参考 在参考代码之前,请仔细阅读下面提到的以下资源/博客! 什么是朴素贝叶斯? 向量化: : CountVectorizer与TFidfVectorizer- v WN18JksF9Cg 什么是停用词? Regex的基础知识-https://www.w3schools.com/python/python_regex.asp#:
【文件预览】:
Multi-label-classification-main
----MIDAS-checkpoint.ipynb(176KB)
----Readme.pdf(593KB)
----README.md(2KB)
----task_code.ipynb(176KB)