文件名称:textclassify:文本分类:bow(词袋特征)、tfidf、word2vec、sklearn
文件大小:8KB
文件格式:ZIP
更新时间:2024-05-22 14:44:27
Python
textclassify 利用bow(词袋特征)、tfidf、word2vec进行中文文本分类 下图为部分数据集 第一列为分类标签,第二列为文本数据,是关于七类文学作品的简介 requirements gensim sklearn bow accuracy=0.918533,precision=0.918528,recall=0.918533,f1=0.918515 tfidf accuracy = 0.931081, precision = 0.931091, recall = 0.931081, f1 = 0.931071 word2vec accuracy = 0.573359, precision = 0.565731, recall = 0.573359, f1 = 0.567236
【文件预览】:
textclassify-master
----README.md(751B)
----visual.py(3KB)
----dataset.py(5KB)
----examples()
--------demo2.csv(74B)
--------bagofwords.py(581B)
--------demo1.csv(60B)
--------tfidf.py(529B)
----main.py(647B)
----model.py(5KB)
----data()
--------下载地址.txt(57B)