文件名称:论文研究-一种可靠信任推荐文本分类特征权重算法.pdf
文件大小:298KB
文件格式:PDF
更新时间:2022-08-11 17:26:14
文本分类,特征权重,可信计算,概率确定性密度,自然语言处理
从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦中文语料集。与TFIDF算法进行性能比较,实验结果显示该算法性能较TFIDF显著提高,并对非平衡语料具有良好的适应性。