文件名称:层次聚类法-文本挖掘PPT
文件大小:406KB
文件格式:PPT
更新时间:2024-05-15 19:45:11
文本挖掘
层次聚类法 具体过程 将文档集D={d1, … ,di , … ,dn} 中的每一个文档di看作是一个具有单个成员的类Ci={di},这些类构成了D的一个聚类C={c1, … ,ci , … ,cn}; 计算C中每对类( ci , cj )之间的相似度sim(ci , cj ); 选取具有最大相似度的类对arg max sim(ci , cj ),并将ci 和cj合并为一个新的类ck=ci∪cj ,从而构成D的一个新的类C={c1, … ,cn-1}; 重复上述步骤,直到C中只剩下一个类为止。 … …