测序原理:边合成边测序
测序特点:
1. 四色荧光基团
分别将四色荧光基团标记在脱氧核苷酸的磷酸基团的末端。当碱基配对完成之后,随着磷酸基团的掉落而掉落,并且不会影响后续的测序过程。
Model Waveguide(ZMW) 70mm 直径的测序微孔
在测序微孔中,聚合酶存在于玻璃板的底部,当聚合酶抓住一个dNTP的时候,会停留一段时间,这时激发波长才会激发基团发出荧光,而孔中其他少量的游离dNTP则不会被激发。
哑铃状文库
DNA分子被接上发卡状的adaptor,因此,构建的文库整个是圆环的分子,利于其周而复始的复制。并且,对于一个片段的重复测序,可以提高准确度,因为不会像illumina测序那样,因为同时测多个碱基而出现phasing 和prephasing的情况,制造噪音限制读长。
测序读长长的原因
就是因为只有一个分子,不会容易出现噪音。
5.缺点
对碱基的判断会出现随机误差,错误率大概是12.5%,但是这种错误可以通过对DNA分子对进行几次测序进行弥补。
6. 限制读长的因素
光照条件下,DNA链可能会出现缺口。
光照条件下,聚合酶可能会变性
文库本身的长度不够,因为建立一个DNA文库,长度>20kb-30kb的文库是有困难的。
7. Pacbio 的测序通量
每张芯片0.3-0.4G数据
测序复合物:包括聚合酶、测序模板,测序引物。在聚合酶上加上生物素,在玻璃板上加上链霉亲和素,将聚合酶固定在玻璃板的底部。芯片上的小孔是随机加入测序复合物的,一张芯片15万个空,其中1/3的小孔是含有一个测序复合物,1/3的小孔是空的,剩下的1/3含有2-3个测序复合物。(根据泊松分布)。空的不会产生信号,而多个测序复合物会产生杂乱的信号,都会失去作用。因此有效的孔数是5万个,每个平均测序长度是8000个碱基,因此平均每张芯片的测序数据量是0.3-0.4G的产出。
可以直接测到被修饰的DNA碱基
因为聚合物遇到模板上被修饰的碱基,例如甲基化的碱基,合成的速度明显被放慢,并且广谱特征也发生改变。这样就可以判断该位置的DNA被甲基化了。
bias
Pacbio的GC bias很小。例如,在PCR过程中,如果模板的GC含量比较高,那么PCR的效率就会比较低。反之,AT含量高,PCR的效率就会高,而传统的建库过程中,PCR的过程比较多,导致的结果就是GC含量高的reads数就会比较差。而Pacbio不是传统的建库方法,其GC bias明显小于PCR建库的illumina或Ion Torrent的测序结果。
10.测序速度
Pacbio的聚合酶可以1s钟合成3个碱基,1小时就是合成1万多个碱基。3个小时就是3万多个碱基,而之后,继续在读的reads数,已经几乎没有了,因此3小时之后基本完成测序。
相对illumina的测序速度,是非常快的,也比Ion Torrent的测序速度也是快一点点的。国内测序的Pacbio大概10-20台。