文件名称:论文研究-基于XML结构相似性的名老中医病例聚类分析.pdf
文件大小:281KB
文件格式:PDF
更新时间:2022-08-11 15:30:34
名老中医病例,可扩展标记语言描述文档,可扩展标记语言编辑距离,聚类算法,模拟退火算法
针对名老中医病例的结构特点,设计了一种基于模拟退火的聚类算法对数据库中病例聚类进行全局优化。病例聚类时,根据一般意义的树间编辑距离,提出一种用于判断XML描述的病例之间是否相似的度量(称为XML编辑距离)。 利用XML编辑距离,可将XML数据间相似性度量的时间复杂度限制在多项式级,且能保持病例的XML描述文档的节点语义信息和节点间的祖孙嵌套关系。最后,在Tamino数据库上进行实验,结果证实了基于模拟退火的病例聚类算法在名老中医数据挖掘实践中的可行性和有效性。