论文研究-基于无监督学习的产品特征抽取.pdf

时间:2022-10-02 20:27:22
【文件属性】:

文件名称:论文研究-基于无监督学习的产品特征抽取.pdf

文件大小:443KB

文件格式:PDF

更新时间:2022-10-02 20:27:22

论文研究

传统特征提取改进方法在特征分布信息的量化方面存在不足,很大程度上影响了其分类效能。针对这一问题,提出一种基于最少出现文档频的特征提取改进方法,即TF-LDF算法。该算法用最少出现文档频来量化特征类间集中度与类内离散度,能够更加准确地反映特征分布情况。通过实验结果比较,可以证明TF-LDF算法分类效果更佳。


网友评论