文件名称:其它应用程序-graph theory and complex networks: an introduction
文件大小:3.68MB
文件格式:PDF
更新时间:2024-06-28 07:09:43
bio-python
12.3 其它应用程序 这里我们讨论一些处理其它的群体遗传学中应用程序的接口和小工具,这些应用程序具有争议,使用得 较少。 12.3.1 FDist:检测选择压力和分子适应 FDist是一个选择压力检测的应用程序包,基于通过 Fst 和杂合度计算(即模拟)得到的“中性”(“neutral”) 置信区间。“中性”置信区间外的 Markers(可以是 SNPs,微卫星,AFLPs 等等)可以被认为是候选的受选 择 marker。 FDist 主要运用在当 marker 数量足够用于估计平均 Fst ,而不足以从数据集中计算出离群点 - 直接地 或者在知道大多数 marker 在基因组中的相对位置的情况下使用基于如 Extended Haplotype Heterozygosity (EHH)的方法。 典型的 FDist 的使用如下: 1. 从其它格式读取数据为 FDist 格式; 2. 计算平均 Fst ,由 FDist 的 datacal 完成; 3. 根据平均 Fst 和期望的总群体数模拟“中性”markers,这是核心部分,由 FDist 的 fdist 完成; 4. 根据指定的置信范围(通常是 95% 或者是 99%)计算置信区间,由 cplot完成,主要用于对区间作图; 5. 用模拟的“中性”置信区间评估每个 Marker 的状态,由 pv 完成,用于检测每个 marker 与模拟的相比 的离群状态; 我们将以示例代码讨论每一步(FDist 可执行二进制文件需要在 PATH 环境变量中)。 FDist 数据格式是该应用程序特有的,不被其它应用程序使用。因此你需要转化你的数据格式到 FDist 可使用的格式。Biopython 可以帮助你完成这个过程。这里有一个将 GenePop 格式转换为 FDist 格式的示 例(同时包括后面示例将用到的 import 语句): from Bio.PopGen import GenePop from Bio.PopGen import FDist from Bio.PopGen.FDist import Controller from Bio.PopGen.FDist.Utils import convert_genepop_to_fdist gp_rec = GenePop.read(open("example.gen")) fd_rec = convert_genepop_to_fdist(gp_rec) in_file = open("infile", "w") in_file.write(str(fd_rec)) in_file.close() 在该段代码中,我们解析 GenePop 文件并转化为 FDist 记录(record)。 输出 FDist 记录将得到可以直接保存到可用于 FDist 的文件的字符串。FDist 需要输入文件名为 infile, 因此我们将记录保存到文件名为 infile 的文件。 FDist 记录最重要的字段(field)是:num_pops,群体数量;num_loci,基因座数量和 loci_data, marker 数据。记录的许多信息对用户来说可能没有用处,仅用于传递给 FDist。 下一步是计算平均数据集的 Fst(以及样本大小): 174 Chapter 12. 第 12 章 Bio.PopGen:群体遗传学