1、Hard and soft selective sweeps
长期以来,快速适应主要与选择作用于高度多基因的数量性状有关,例如在育种试验期间。这些性状可以通过对大量已经存在的多态性的群体频率的微小调整,对选择压力的变化作出快速反应。在这个所谓的“无穷小模型”下,适应性预计会在群体基因组数据中留下微妙的特征,因为潜在的多态性可能在群体中存在了足够长的时间,从而与其周围的遗传变异脱钩。然而,最近的研究表明,快速适应往往只涉及少数几个具有巨大个体效应的等位基因,而这些等位基因以前在种群中很少见,甚至不存在。突出的例子包括昆虫[3]的抗药性进化,沙滩老鼠[4]的颜色模式,刺鱼[5]的淡水适应,以及人类乳糖的持久性。我们描述这些情况下适应的群体遗传学的标准模型是所谓的“选择性扫描”。与无穷小模型相比,在选择扫描中,自适应等位基因较少见,与周围遗传变异仍处于连锁不平衡(LD)状态,正选择使其种群频率发生显著变化。
选择性清除可以是“硬”的,即单个自适应等位基因在群体中清除;也可以是“软”的,即多个自适应等位基因在同一位点同时在群体中清除。根据定义,是否硬或软扫描在一个给定的群体样本是由自适应的谱系等位基因在选定的位点决定:在硬性扫中,携带自适应等位基因的谱系在样例合并最近爆发比积极的选择,也就是说,当它第一次成为有利的时间点进行等位基因(图1)。
相比之下,在软扫描中,它们在积极选择开始之前就结合在一起。因此,在大多数情况下,一个样本中存在多个独立起源的自适应突变的扫描应该是软的,无论这些突变是在积极选择开始后从头开始出现的(图1B),还是之前已经作为常设遗传变异出现(图1C,第一行)。然而,自适应等位基因只出现一次,但在积极选择开始前达到一定频率,然后在群体中出现多个拷贝的情况仍然存在。
Selective sweeps can be ‘hard’, where a single adaptive allele sweeps through the population, or ‘soft’, where multiple adaptive alleles at the same locus sweep through the population at the same time []. By definition, whether a sweep is hard or soft in a given population sample is determined by the genealogy of adaptive alleles at the selected site: in a hard sweep, the lineages in the sample that carry the adaptive allele coalesce more recently than the onset of positive selection, that is, the point in time when it first became advantageous to carry the allele (Figure 1A). By contrast, in a soft sweep, they coalesce before the onset of positive selection. Thus, sweeps in which several adaptive mutations of independent origin are present in a sample should be soft in most cases, regardless of whether the mutations arose de novo after the onset of positive selection (Figure 1B) or were already present previously as standing genetic variation (Figure 1C, top row). However, a situation where the
adaptive allele arose only once but reached some frequency before the onset of positive selection, and several copies
then swept through the population, is still considered a soft sweep if the lineages coalesce before the onset of positive selection (Figure 1C, bottom row)
请注意,上面对硬扫描和软扫描的定义是基于总体样本的。因此,同样的自适应事件可能在一个样本中产生软扫描,但在另一个样本中保持硬扫描,这取决于取样的等位基因。例如,如果只从图1B中选择6个蓝色个体,那么在这个子样本中进行扫描将会非常困难。我们还想强调的是,我们在这篇综述中采用的选择性清除的概念仅仅是指特定位点上自适应等位基因的种群动态以及在群体基因组数据中产生的信号。这一定义没有考虑到相关突变的实际分子性质,这些突变通常是未知的。这一定义的一个结果是,原则上,不同的适应性突变有助于在给定的基因位点上进行扫描,它们不一定来自相同的选择压力。当我们讨论选择性扫描相关基因位点的定义时,我们将在下面更详细地解释这一点。适应性产生硬扫描还是软扫描主要取决于适应性突变的可用性。
适应性产生硬扫描还是软扫描主要取决于适应性突变的可用性。当选择压力开始时种群中不存在自适应等位基因,且等待自适应突变的时间较长时,就会出现硬扫描。相比之下,当自适应突变出现之前的等待时间比该突变在种群中传播所需的时间短时,预期会出现软扫描。