文件名称:Divisive-Hierarchical-Clustering:在Divisive中,我们最初将所有点集中在一个群集中,然后将群集分解为所需数量的群集
文件大小:72KB
文件格式:ZIP
更新时间:2024-06-07 05:16:02
amino-acids hierarchical-clustering dendrogram divisive-clustering Python
划分层次聚类(自上而下) 在分裂或自上而下的聚类方法中,我们将所有观测值分配给一个聚类,然后将该聚类划分为两个最不相似的聚类。 最后,我们在每个聚类上递归进行,直到每个观察有一个聚类。 有证据表明,在某些情况下,分裂算法比凝聚算法产生更准确的层次结构,但从概念上讲更为复杂。 主意 系统发育树或进化树是分支图或“树”,其显示了基于其物理或遗传特征的相似性和差异而推断出的各种生物物种之间的进化关系。 该任务的目标是使用聚集(自下而上)和分裂(自上而下)层次聚类,基于数据集中给出的物种的DNA /蛋白质序列构建系统发育树。 数据集 原始数据集由人类基因的氨基酸序列组成。 链接到数据集: chr10_1000 MAQTRYTQNRWRNEACREKALSTCGCSANVSQPTITTLLTPLTSETTPLREILVVSLKRK GSDDVRHAIKDNNTLCPFVILKEPINAPSLV
【文件预览】:
Divisive-Hierarchical-Clustering-master
----Preprocess.py(1KB)
----Divisive.JPG(74KB)
----README.md(2KB)
----Divisive.py(4KB)
----data_amino2.txt(53KB)