【文件属性】:
文件名称:textclassify:文本分类:bow(词袋特征)、tfidf、word2vec、sklearn
文件大小:8KB
文件格式:ZIP
更新时间:2021-05-02 20:57:47
Python
textclassify
利用bow(词袋特征)、tfidf、word2vec进行中文文本分类
下图为部分数据集
第一列为分类标签,第二列为文本数据,是关于七类文学作品的简介
requirements
gensim
sklearn
bow
accuracy=0.918533,precision=0.918528,recall=0.918533,f1=0.918515
tfidf
accuracy = 0.931081, precision = 0.931091, recall = 0.931081, f1 = 0.931071
word2vec
accuracy = 0.573359, precision = 0.565731, recall = 0.573359, f1 = 0.567236
【文件预览】:
textclassify-master
----README.md(751B)
----visual.py(3KB)
----dataset.py(5KB)
----examples()
--------demo2.csv(74B)
--------bagofwords.py(581B)
--------demo1.csv(60B)
--------tfidf.py(529B)
----main.py(647B)
----model.py(5KB)
----data()
--------下载地址.txt(57B)
网友评论
- 获取数据的密码不对[face]emoji:002.png[/face]