论文研究-基于全切分获取网络流行语方法研究.pdf

时间:2022-08-11 16:36:56
【文件属性】:

文件名称:论文研究-基于全切分获取网络流行语方法研究.pdf

文件大小:517KB

文件格式:PDF

更新时间:2022-08-11 16:36:56

网络流行词语,中文信息处理,全切分

利用统计和规则相结合的算法从互联网的动态信息流中提取网络流行语。在利用全切分算法获取候选词集的基础上,依次对候选词集进行三次过滤:首先基于向量空间模型的权重过滤,运用语言模型进行过滤;然后利用垃圾串过滤规则获取网络流行词语候选词集;最后利用提出的流行词语评分模型进行筛选得到网络流行词语。实验表明,在不影响流行词语准确率的前提下,利用该方法自动获取网络流行词语的速度明显提高。


网友评论