1 FindVariableFeatures()–特征选择:
高变异基因就是highly variable features(HVGs),就是在细胞与细胞间进行比较,选择表达量差别最大
的基因,Seurat使用FindVariableFeatures函数鉴定高可变基因,这些基因在不同细胞之间的表达量差异很大(在一些细胞中高表达,在另一些细胞中低表达)。默认情况下,会返回2,000个高可变基因用于下游的分析,如PCA等。
利用FindVariableFeatures函数,会计算一个mean-variance结果,也就是给出表达量均值和方差的关系并且得到top variable features,这一步的目的是鉴定出细胞与细胞之间表达量相差很大的基因,用于后续鉴定细胞类型。
2 FindMarkers()–寻找差异表达基因:
Seurat使用FindMarkers和FindAllMarkers函数进行差异表达基因的筛选
两篇很好的单细胞分析问答贴Confusion about FindMarkers(), FindVariableFeatures(),RunTSNE(), and RunUMAP() in seurat package:
/p/406388/
/p/5a06ebfba7bd