文档相似度计算-文本挖掘PPT

时间:2024-05-15 19:45:06
【文件属性】:

文件名称:文档相似度计算-文本挖掘PPT

文件大小:406KB

文件格式:PPT

更新时间:2024-05-15 19:45:06

文本挖掘

文档相似度计算 余弦计算法(cosine measure) 余弦相似度定义: 其中 为两个文档向量, 内积 为标准向量点积,定义为 , 定义为 。 缺点:文档“无限”,导致矩阵增大,计算量增加


网友评论