文件名称:论文研究-从基因表达数据中有效挖掘差异共表达双聚类:DiCluster算法.pdf
文件大小:2MB
文件格式:PDF
更新时间:2022-08-11 14:26:09
基因表达数据, 双聚类, 差异共表达
双聚类是一种可以同时在基因和条件两个维度上分析基因表达数据的方法, 它可以找出在部分条件下具有相似表达趋势的基因。已有的方法都是从一个数据集中挖掘双聚类。从生物意义上分析, 从不同基因表达数据集中挖掘差异表达双聚类可以发现具有生物意义的转录因子等信息。因此, 提出一种挖掘不同数据集上差异共表达双聚类的算法——DiCluster。该算法采用深度优先基因扩展方法, 并引入了剪枝策略, 有效挖掘最大差异表达双聚类。实验结果表明, DiCluster不仅比已有算法具有更高的效率, 而且挖掘出的结果具有更好的统计学意义和生物学意义。