层次聚类法-文本挖掘PPT

时间:2024-05-15 19:45:11
【文件属性】:

文件名称:层次聚类法-文本挖掘PPT

文件大小:406KB

文件格式:PPT

更新时间:2024-05-15 19:45:11

文本挖掘

层次聚类法 具体过程 将文档集D={d1, … ,di , … ,dn} 中的每一个文档di看作是一个具有单个成员的类Ci={di},这些类构成了D的一个聚类C={c1, … ,ci , … ,cn}; 计算C中每对类( ci , cj )之间的相似度sim(ci , cj ); 选取具有最大相似度的类对arg max sim(ci , cj ),并将ci 和cj合并为一个新的类ck=ci∪cj ,从而构成D的一个新的类C={c1, … ,cn-1}; 重复上述步骤,直到C中只剩下一个类为止。 … …


网友评论