文件名称:NLP实战之sklearn+逻辑回归进行THUCNews文本分类python
文件大小:48.44MB
文件格式:RAR
更新时间:2023-06-10 04:53:12
NLP 逻辑回归 文本分类 sklearn 机器学习
通过对数据进行分词、停词过滤、TfidfVectorizer/CountVectorizer处理,利用sklearn中是逻辑回归对THUCNews进行分类,包含数据集
【文件预览】:
cnews.val.txt
LR.py
cnews.test.txt
CNEWS_test.py
LR_CountVectorizer.py
cnews.vocab.txt
cnews.train.txt