文件名称:sommatlab代码-geneMap:基因图
文件大小:3.39MB
文件格式:ZIP
更新时间:2024-06-15 07:06:54
系统开源
som matlab代码基因图 Matlab实现的针对HGDP SNP基因分型数据的自组织图。 要与其他降维方法进行比较,请参见L. van der Maaten的Matlab降维工具箱。 ###包括 预处理的HGDP数据 原始数据取自斯坦福大学的人类基因组多样性项目 1,043个样本,尺寸为660,918,减少为1,043(映射到样本空间)。 可以通过PCA进一步降低。 TODO:数据预处理的详细信息(缺失值,两个等位基因) 算法的标准批次排序和收敛阶段 遵循T. Kohonen的MATLAB自实施图的MATLAB实现和应用中的建议设置默认参数。 前两个主要部分中的重量排序视频跟踪 在运行代码期间,生成的结果显示了投影到前两个主要组件的SOM网格 映射数据的图 比较训练数据映射到网格的节点,按地区和国家/人口来区分样本。 ###去做 减少,将SOM更新与k-means更新结合在一起。 在训练期间将节点自适应地添加到网格 映射到曲面而不是网格节点 六角连通性(?) 实施代表性比较ala Al-Oqaily&Kennedy 2008 ###可视化示例: PCA 东北电力公司 SOM关于区
【文件预览】:
geneMap-master
----NS_660755markersPreprocessed.txt(7.9MB)
----FormAdjacencyMatrix.m(947B)
----pics()
--------epoch40_90_150.jpg(231KB)
--------pca.png(41KB)
--------0.5x tau.png(77KB)
--------distance between nodes in grid.png(37KB)
--------triangles as validation samples.png(42KB)
--------2x tau .png(179KB)
--------tsne.png(79KB)
--------pca var explained.png(3KB)
--------dataRaw.jpg(62KB)
--------pca local.png(12KB)
--------types of maps.png(211KB)
--------distance grid node to nearest sample.png(31KB)
----SoCS_SampleInfo.txt(7KB)
----PlotKohonenMap.m(2KB)
----Ordering.m(2KB)
----PlotPCA.m(797B)
----FindWinnersFinal.m(1KB)
----CompetitionUpdate.m(829B)
----README.md(2KB)
----MAIN.m(2KB)
----PlotMap.m(2KB)