文件名称:使用最大熵模型进行中文文本分类
文件大小:755KB
文件格式:PDF
更新时间:2015-06-18 08:32:02
最大熵模型 中文 文本分类
随着W W W 的迅猛发展, 文本分类成为处理和组织大量文档数据的关键技末 1 由于最大嫡模型 可以综合观察到各种相关或不相关的概率知识, 对许多问题的处理都可以达到较好的结来 . 但是, 将最 大嫡模型应用在文本分类中的研究却非常少, 而使用最大嫡模型进行中文文本分类的研究尚未见到. 使用最大墒模型进行了中文文本分类 . 通过实验比较和分析了不同的中文文本特征生成方法、不同的 特征数目, 以及在使用平滑技术的情况下, 基于最大嫡模型的分类器的分匆险能并且将其和Ba ye S , K N N , S V M 三种典型的文本分类器进行了比较, 结果显示它的分类性能胜于Bay es 方法, 与K N N 和 sv M 方法相当, 表明这是一种非常有前途的文本分类方法