aCGH芯片分析简介

时间:2024-05-18 17:39:59

欢迎关注”生信修炼手册”!

aCGH芯片是一种双色芯片,通过红绿两种荧光的比值,通常称之为log2 ratio, 来反应测试样本相对对照样本的DNA拷贝数变化。aCGH芯片的分析,通常包含以下三个步骤

1. 归一化

归一化的作用有两个,第一个是校正系统误差,第二个是使得不同样本的log2 ratio可以直接比较。在aCGH芯片种,系统误差包含以下几种

  1. intensity bias, 荧光信号强度的误差

  2. spatial bias, 空间误差,如下图所示,载玻片上不同位置, 即不同spot的log2 ratio值分布有差异
    aCGH芯片分析简介

  3. plate bias, 芯片上的spot分属于不同的plate, 不同plate的log2 ratio分布也有明显差异

  4. background bias, 背景误差,测量到的荧光强度中有一部分来自背景荧光

    原始的芯片数据只有经过了归一化之后,才可以进行下一步分析。

2. segmentation

segmentation这一步是将基因组划分为不重叠的区域,每个区域内的拷贝数是一致的, 如下图所示

aCGH芯片分析简介

蓝色的点代表log2 ratio值,红色的线代表划分好之后的区域,每个区域内的log2 ratio校正到一个统一的值,比如均值。划分好的每个区域称之为segment,不同区域之间的点称之为breakpoint。

3. calling

calling的意思是分析每个segment上的拷贝数变化,根据segment片段对应的log2 ration值,只能够得到结论,测试样本相对对照样本的拷贝数变化,有以下3种情况

  1. normal, 拷贝数没有发生变化, 通常用数字0表示

  2. loss, 拷贝数减少,通常用数字-1表示

  3. gain, 拷贝数增多,通常用数字+1表示,当增加的很多,对于二倍体,通常大于5时,称之为amplification

分析aCGH芯片的软件很多,不同软件归一化,segmention的算法会有所不同,但是分析的步骤都是上述这几步,为了方便下游分析,有一种存储拷贝数变异的文件格式,称之为SEG, 内容示意如下

aCGH芯片分析简介

是一种\t分隔的穿文本格式,第一列是样本ID, 第二列到第四列描述的是segment对应的染色体区域,第五列代表该segment区域包含的探针个数,在基于NGS的CNV分析中,这一列表示包含的bin区间的个数,第六列代表该区域内log2 ratio的均值。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

aCGH芯片分析简介