文件名称:基于知网的概念特征抽取方法
文件大小:196KB
文件格式:PDF
更新时间:2015-12-03 11:12:50
知网 概念 特征抽取
基于知网的概念特征抽取方法 文本特征抽取是文本过滤的一项重要基础但通常采取的用字词作为特征项的显著缺 点是无法表达文本的语义信息所以本文在向量空间模型的基础上提出了一种以知网为语义知识 库基于语义信息的文本特征项抽取方法该方法比单纯的词汇信息更能体现文本的概念特征 提高过滤系统的性能同时还能降低文本向量的维数减少计算量提高过滤效率我们在引入 了该方法的中文文本过滤系统上进行的实验结果也充分证实了其有效性