欢迎关注”生信修炼手册”!
aCGH芯片是一种双色芯片,通过红绿两种荧光的比值,通常称之为log2 ratio, 来反应测试样本相对对照样本的DNA拷贝数变化。aCGH芯片的分析,通常包含以下三个步骤
1. 归一化
归一化的作用有两个,第一个是校正系统误差,第二个是使得不同样本的log2 ratio可以直接比较。在aCGH芯片种,系统误差包含以下几种
intensity bias, 荧光信号强度的误差
spatial bias, 空间误差,如下图所示,载玻片上不同位置, 即不同spot的log2 ratio值分布有差异
plate bias, 芯片上的spot分属于不同的plate, 不同plate的log2 ratio分布也有明显差异
-
background bias, 背景误差,测量到的荧光强度中有一部分来自背景荧光
原始的芯片数据只有经过了归一化之后,才可以进行下一步分析。
2. segmentation
segmentation这一步是将基因组划分为不重叠的区域,每个区域内的拷贝数是一致的, 如下图所示
蓝色的点代表log2 ratio值,红色的线代表划分好之后的区域,每个区域内的log2 ratio校正到一个统一的值,比如均值。划分好的每个区域称之为segment,不同区域之间的点称之为breakpoint。
3. calling
calling的意思是分析每个segment上的拷贝数变化,根据segment片段对应的log2 ration值,只能够得到结论,测试样本相对对照样本的拷贝数变化,有以下3种情况
normal, 拷贝数没有发生变化, 通常用数字0表示
loss, 拷贝数减少,通常用数字-1表示
gain, 拷贝数增多,通常用数字+1表示,当增加的很多,对于二倍体,通常大于5时,称之为amplification
分析aCGH芯片的软件很多,不同软件归一化,segmention的算法会有所不同,但是分析的步骤都是上述这几步,为了方便下游分析,有一种存储拷贝数变异的文件格式,称之为SEG, 内容示意如下
是一种\t
分隔的穿文本格式,第一列是样本ID, 第二列到第四列描述的是segment对应的染色体区域,第五列代表该segment区域包含的探针个数,在基于NGS的CNV分析中,这一列表示包含的bin区间的个数,第六列代表该区域内log2 ratio的均值。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!