文件名称:WEB挖掘系统的设计与实现
文件大小:242KB
文件格式:PDF
更新时间:2011-11-06 16:17:36
WEB挖掘
介绍了Web挖掘理论,包括Web挖掘定义、Web挖掘任务、Web挖掘分类3个方面,井简单介绍了实现Web义本挖掘系统WTMiner (WebText M r)的几个关键技术:分词,特征提取,分类器的设计。在分词中采用了支持首字Hash;二分查找从而提高了分词速度,分类 器的没计中考虑到sVM的训练算法速度慢的缺点,用近邻法以减少洲练样本集中样本的数量,从而大大提高了算法速度。