参考:
单细胞实战(三) Cell Ranger使用初探
接下来就是用 cell ranger 软件进行分析,但是有一个前提,需要我们注意,系统性能要非常好,一般不太需要我们去做,很多文章都说这儿只需要了解一下,知道大概流程就行。
系统要求:
Linux 至少8核
CPU(推荐16核)64GB
RAM(推荐128GB),最低配的64G,允许cellranger aggr合并最多250k个细胞
1T硬盘
64-bit CentOS/RedHat 6.0 or Ubuntu 12.04
- 1
- 2
- 3
- 4
- 5
- 6
cell ranger 软件分为下面四大部分:
cellranger mkfastq : 它借鉴了Illumina的bcl2fastq ,可以将一个或多个lane中的混样测序样本按照index标签生成样本对应的fastq文件
cellranger count :利用mkfastq生成的fq文件,进行比对(基于STAR)、过滤、UMI计数。利用细胞的barcode生成gene-barcode矩阵,然后进行样本分群、基因表达分析
cellranger aggr :接受cellranger count的输出数据,将同一组的不同测序样本的表达矩阵整合在一起,比如tumor组原来有4个样本,PBMC组有两个样本,现在可以使用aggr生成最后的tumor和PBMC两个矩阵,并且进行标准化去掉测序深度的影响
cellranger reanalyze :接受cellranger count或cellranger aggr生成的gene-barcode矩阵,使用不同的参数进行降维、聚类
cell ranger 软件分析的结果主要是包含有细胞信息的BAM, MEX, CSV, HDF5 and HTML等文件
#下载软件
curl -o cellranger-2.1. "http://cf./releases/cell-exp/cellranger-2.1.?Expires=1557260110&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cDovL2NmLjEweGdlbm9taWNzLmNvbS9yZWxlYXNlcy9jZWxsLWV4cC9jZWxscmFuZ2VyLTIuMS4xLnRhci5neiIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTU1NzI2MDExMH19fV19&Signature=RNQd-gTASTQhtnUSBfQWrnqo6Pyy2wDXtV5tlxkG97727GvoRhMqFXbEsz4gJl2BMckdVvW3S1tZRwRo5pmxPzmhq-8RKxf99pGqlzo84HYqhbIRkxXlIbLbj-u3PUJqo8cesWpbSVSKkS2TCNS-9GMFNieQswqMS2-DN4BqoBOJnWr7T4wlOMd9hypXWwOsW2P2fqaM-WP2ooMyo-oIxm3y9gDghXdDEP5lvHU7GCQcFGGexkdIrD6S5p8JPJ1DB5XieGrtEuP1YVp6tLMGXFoRWXS8dQLI1egWDYlOuRaiQgLIb3o5ZxBg5NpzLPP5kDHMAVzJFdBpf~~rkyNYTA__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"
#解压
tar zxvf cellranger-2.0.
export PATH=/home/biosoft/cellranger-3.0:$PATH
echo $PATH
- 1
- 2
- 3
- 4
- 5
- 6
- 7
cellranger (2.0.2)
结果如下:
usage:
cellranger mkfastq
cellranger count
cellranger aggr
cellranger reanalyze
cellranger mkloupe
cellranger mat2csv
cellranger mkgtf
cellranger mkref
cellranger vdj
cellranger mkvdjref
cellranger testrun
cellranger upload
cellranger sitecheck
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
我们还需要下载一个参考基因组,去官网下载就好了,这样还省得我们自己用cell ranger 构建特定的参考基因组,自己尝试构建的话参考单细胞实战(三) Cell Ranger使用初探。
curl -O http://cf./supp/cell-exp/refdata-cellranger-GRCh38-1.2.
# 然后解压
tar -xzvf refdata-cellranger-GRCh38-1.2.
- 1
- 2
- 3
CellRanger走起(四) Cell Ranger流程概览 里面有上述四个主要功能具体的代码如何编写和运行,可以看一下。
其中,filtered_gene_bc_matrices:是重要的一个目录,下面又包含了 、、,是下游Seurat、Scater、Monocle等分析的输入文件。这一点需要注意,去GEO数据库下载相应的数据时,下载到表达矩阵即可。
cell ranger:从拆库到定量也是个优秀的网站。