nlp_naivebayes_textclassifier:语

时间:2021-05-04 10:42:33
【文件属性】:
文件名称:nlp_naivebayes_textclassifier:语
文件大小:6.59MB
文件格式:ZIP
更新时间:2021-05-04 10:42:33
Python 自述文件 语言:Python创建了一个朴素的贝叶斯文本分类器(nblearn.py,nbclassify.py),并将准确性与两个流行的机器学习工具包进行了比较。 使用两个数据集(电子邮件和IMDB评论)并进行了二进制分类:SPAM或HAM(非垃圾邮件)以及POSITIVE或NEGATIVE(情感分析)。 比较了进行这些分类的三种机器学习技术:朴素贝叶斯分类,最大熵建模和支持向量机(MegaM和SVM-Light)。 report.txt-包含有关要运行的脚本序列以及要传递每个python脚本的cmd参数的详细说明。
【文件预览】:
nlp_naivebayes_textclassifier-master
----megam_preprocess.py(2KB)
----spam.svm.out(56KB)
----sentiment.svm.model(9.26MB)
----insertlabel.py(2KB)
----spam.svm.model(2.62MB)
----spamtest_preprocess.py(2KB)
----createchk.py(1KB)
----count.py(2KB)
----sentiment.nb.model(3.89MB)
----nbclassify.py(3KB)
----spam.megam.out(56KB)
----sentiment.svm.out(220KB)
----feat_to_test_file_gen.py(593B)
----svm_preprocess.py(2KB)
----sentiment.megam.model(2.51MB)
----sentiment.megam.out(220KB)
----spam.nb.out(56KB)
----sentiment.nb.out(220KB)
----report.txt(13KB)
----spam.nb.model(5.2MB)
----shuf.py(256B)
----shufsplit.py(2KB)
----megam_postprocess.py(905B)
----addonefeat.py(988B)
----email_preprocess.py(2KB)
----.gitignore(574B)
----svm_postprocess.py(775B)
----nblearn.py(3KB)
----README.md(634B)
----spam.megam.model(3.33MB)
----.gitattributes(378B)
----imdb_preprocess.py(1KB)

网友评论