文件名称:文本挖掘 – 信息提取 ppt
文件大小:635KB
文件格式:PPT
更新时间:2012-07-28 07:34:54
文本挖掘 – 信息提取
Text Mining (1) 文本本来是给人读的,不是计算机 大多数信息以文本形式存储 100 times as much online text as online DBs HTML网页是带有结构标记的文本(带来机会和挑战) 数据挖掘操作的是数据表 (i.e. numbers, fixed fields, adherence to data models).