基于KNN的垃圾邮件分类实验

时间:2024-06-18 05:27:40
【文件属性】:

文件名称:基于KNN的垃圾邮件分类实验

文件大小:3.65MB

文件格式:RAR

更新时间:2024-06-18 05:27:40

KNN 垃圾邮件分类 机器学习 数据挖掘 python

使用到的数据集是I. Androutsopoulos, J. Koutsias, K.V. Chandrinos, George Paliouras和 C.D. Spyropoulos的 "An Evaluation of Naive Bayesian Anti-Spam Filtering"中使用到的垃圾邮件语料库:lingspam_public。 stopwords我是直接调用的,后续在文件中有另外增加无效词。 详细信息可以参看我的博文:https://blog.csdn.net/qq_43262059/article/details/117379888


【文件预览】:
相关代码
----dic_f.txt(26KB)
----normal_wc.txt(15.61MB)
----words_cloud.py(740B)
----spamknn.py(4KB)
----dic_sort.txt(903KB)
----spamknnpre.py(3KB)
----normal_wc.png(394KB)
----spam_wc.txt(2.66MB)
----spamknntest.py(2KB)
----email_vector_train.txt(99.39MB)
----spam_wc.png(431KB)

网友评论