文字分类

时间:2024-03-13 22:54:50
【文件属性】:

文件名称:文字分类

文件大小:368KB

文件格式:ZIP

更新时间:2024-03-13 22:54:50

JupyterNotebook

文字分类 对仅具有4个类别的“ 20个新闻组数据集”的数据集执行了文本分类。 对令牌词执行了令牌化,清理和POS标记。 使用带有过滤器,PMI,T检验和卡方技术的“频率”,找出显示两个相邻单词的二元词。 使用SVM和多项式朴素贝叶斯进行文本分类。 针对以下内核的SVM的绘制混淆矩阵:线性SVM,RBF SVM,Poly SVM,Sigmoid SVM。


【文件预览】:
TextClassification-master
----A2-Shrey_Amin-Harsh_Pamnani.pdf(343KB)
----A2-Shrey_Amin-Harsh_Pamnani.ipynb(200KB)
----README.md(478B)

网友评论