Web文本挖掘技术研究

时间:2015-04-26 07:12:26
【文件属性】:

文件名称:Web文本挖掘技术研究

文件大小:247KB

文件格式:PDF

更新时间:2015-04-26 07:12:26

Web挖掘,文本挖掘, 文本分类,文本聚类, 多维文本分析

作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术, Web挖掘正悄然兴起, 倍受关注. 目前, Web挖掘的研究正处于发展阶段, 尚无统一的结论,需要国内外学者在理论上开展更多的讨论. 同时,Web挖掘系统的开发对其研究也将起到很大推进作用. 首先探讨了Web挖掘的有关理论, 从Web挖掘的定义、Web挖掘与Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述. 然后重点分析了Web文本挖掘的方法, 包括: 文本的特征表示、文本分类与文本聚类. 在此基础上简单介绍了一个Web文本挖掘系统原型WebMiner. WebMiner 采用了多agent 体系结构, 将多维文本分析与文本挖掘这两种技术有机地结合起来, 以帮助用户快速、有效地挖掘Web上的HTML文档.


网友评论