基于聚类分析的网络舆情监控系统的设计 (2011年)

时间:2024-06-17 10:54:10
【文件属性】:

文件名称:基于聚类分析的网络舆情监控系统的设计 (2011年)

文件大小:791KB

文件格式:PDF

更新时间:2024-06-17 10:54:10

自然科学 论文

目的结合中文信息处理技术,设计一个网络舆情监控系统;针对网络舆情挖掘研究中存在的问题,提出了一种K- means改进算法,实现Web挖掘基础上的文本聚类与主题发现。方法构建一个基于聚类分析的网络舆情监控系统,并详细介绍系统各个模块用到的关键技术;提出了一种K- means改进算法,对K-means算法中的关键环节(聚类初始值的选择和孤立点的剔除)进行了改进。结果设计的系统能通过对网页、论坛、博客、新闻评论等网络资源的精确采集,并结合网页净化、中文分词、向量模型建立、特征选择、降维处理,文本聚类等中文信息处


网友评论