【文件属性】:
文件名称:文本分类-文本挖掘PPT
文件大小:406KB
文件格式:PPT
更新时间:2021-04-26 01:58:30
文本挖掘
文本分类
一般方法
将预先分类过的文档作为训练集
从训练集中得出分类模式(需要测试过程,不断细化)
用导出的分类模式对其它文档加以分类
基于关联的分类方法
通过信息检索技术和关联分析技术提出关键字和词汇
利用已有的词类生成关键字和词的概念层次(文档类别)
利用关联挖掘方法去发现关联词, 进而区分各类文档(每一类文档对应一组关联规则)
用关联规则去对新的文档分类