基于加权词向量和卷积神经网络的新闻文本分类

时间:2024-05-26 06:00:50
【文件属性】:

文件名称:基于加权词向量和卷积神经网络的新闻文本分类

文件大小:922KB

文件格式:PDF

更新时间:2024-05-26 06:00:50

文本分类 TF-IDF技术 Skip-gram模型 词向量 卷积神经网络

在文本分类中,基于Word2Vec词向量的文本表示忽略了词语区分文本的能力,设计了一种用TF-IDF加权词向量的卷积神经网络(CNN)文本分类方法.新闻文本分类,一般只考虑正文,忽略标题的重要性,改进了TF-IDF计算方法,兼顾了新闻标题和正文.实验表明,基于加权词向量和CNN的新闻文本分类方法比逻辑回归分类效果有较大提高,比不加权方法也有一定的提高.


网友评论