文件名称:基于特征项扩展的中文文本分类方法 (2010年)
文件大小:217KB
文件格式:PDF
更新时间:2024-05-18 04:10:21
工程技术 论文
提出了一种基于特征项扩展的中文文本分类方法。该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能力。最后利用扩展的特征项集提取特征进行分类。该文重点研究了如何抽取特征义原,如何给扩展项设定一个合适的权值。实验证明,该文方法能增加有效的特征项的数目,使分类正确率和稳定性均得到提高。