文件名称:论文研究-Web文本特征选择算法的研究.pdf
文件大小:131KB
文件格式:PDF
更新时间:2022-08-11 14:44:08
文本表示,向量空间模型,特征选择,熵
以向量空间模型作为Web文本的表示方法,结合Web文本的结构特征对向量空间模型中的特征选择算法进行了分析并加以改进。在改进的算法中,体现出了特征词在Web文档结构中的位置信息;引入了信息论中熵的概念,用词的熵函数对权值进行调整,从而更加准确地选取有效的特征词。实验验证了改进算法的可行性和有效性。
文件名称:论文研究-Web文本特征选择算法的研究.pdf
文件大小:131KB
文件格式:PDF
更新时间:2022-08-11 14:44:08
文本表示,向量空间模型,特征选择,熵
以向量空间模型作为Web文本的表示方法,结合Web文本的结构特征对向量空间模型中的特征选择算法进行了分析并加以改进。在改进的算法中,体现出了特征词在Web文档结构中的位置信息;引入了信息论中熵的概念,用词的熵函数对权值进行调整,从而更加准确地选取有效的特征词。实验验证了改进算法的可行性和有效性。