NCBI原始数据下载by Aspera Connect

时间:2021-08-21 10:50:53

主要参考这篇文章:

http://mp.weixin.qq.com/s?__biz=MzA5NjU5NjQ4MA==&mid=2651154488&idx=1&sn=e693a1a1f8163960e99812a6d7473aa0&scene=23&srcid=0831PboACKYo6omCEfKhXLhV#rd

因为昨天刚装了centOS,所以这里只贴出linux下的操作:

1. 进入linux服务器,下载aspera。

输入:wgethttp://downloads.asperasoft.com/download/sw/connect/3.1/aspera-connect-3.1.1.70545-linux-64.tar.gz

将会开始下载。

2. 下载完毕后,解压,输入: tar xvf aspera-connect-3.1.1.70545-linux-64.tar.gz

3. 安装输入:sh aspera-connect-3.1.1.70545-linux-64.sh

4. cd 到/home/usrname文件夹,ls-a就能看到 .aspera

这就是安装的文件夹。

5. 重要一步,添加环境变量,否则不能用。输入  

exportPATH=$PATH:/home/username/.aspera/connect/bin

6. 数据下载。

可以按照这个模板去下载了SRA数据(如果很多可以把所有命令写到一个shell里面,nohup提交睡大觉去就可以了,明早一醒,全部ok)

nohup /home/usrname/.aspera/connect/bin/ascp -i/home/usrname/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByRun/sra/SRR/SRR949/SRR949627/SRR949627.sra./ &    

可以按照此模板下载基因组相关数据

~/.aspera/connect/bin/ascp -i~/.aspera/connect/etc/asperaweb_id_dsa.openssh -k 1 -T -l200manonftp@ftp-private.ncbi.nlm.nih.gov:genomes/all/GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz./

其中GCF_000147175.1_CamFlo_1.0/GCF_000147175.1_CamFlo_1.0_genomic.fna.gz根据你要下载的基因组改成NCBI FTP上的基因组、GFF和CDS文件名字

其他类型数据类似