Ubuntu18.04安装Aspera批量下载SRA数据

时间:2024-12-16 20:04:02

安装

aspera只能安装在用户目录,创建用户

下载链接可在IBM网站获取

Aspera - Connect | IBM 

/connect_latest/v4/bin/ibm-aspera-connect_4.1.0.46-linux_x86_64.

也可以从本地使用WinSCP上传到服务器

  1. adduser wyl
  2. su wyl
  3. cd /home/wyl
  4. wget https:///connect_latest/v4/bin/ibm-aspera-connect_4.1.0.46-linux_x86_64.
  5. tar -zxvf ibm-aspera-connect_4.1.0.46-linux_x86_64.
  6. ./ibm-aspera-connect_4.1.0.46-linux_x86_64.sh
  7. # 记得切换到root模式添加环境变量,不然就只能在用户下使用
  8. su root
  9. echo """export PATH=\"/home/wyl/.aspera/connect/bin:\$PATH\" """ >> ~/.bashrc
  10. source ~/.bashrc
  11. ascp -h

下载单个(批量)SRA

ENA Browser查找SRA数据

单个下载

  1. # 如:使用aspera以最高300m限速下载EBI数据库里的SRR11966532_1.文件到/mnt/sra目录
  2. ascp -QT -l 300m -P33001 -i /home/wyl/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@:vol1/fastq/SRR119/032/SRR11966532/SRR11966532_1. /mnt/sra
  3. # ascp各个参数使用可以用ascp -h查看

批量下载

1. 创建

  1. cat
  2. SRR11903615
  3. SRR11903616
  4. SRR11903617
  5. SRR11966532

2. 在同一文件夹创建

  1. vi
  2. # 按i进入insert模式,输入以下代码
  3. -------------------
  4. #!/bin/bash
  5. for i in $(cat )
  6. do
  7. x=$(echo $i | cut -b1-6)
  8. y=$(echo $i | cut -b10-11)
  9. echo "vol1/fastq/${x}/0${y}/${i}/${i}_1." >> id_trim.txt
  10. echo "vol1/fastq/${x}/0${y}/${i}/${i}_2." >> id_trim.txt
  11. done
  12. ascp -v -QT -l 300m -P33001 -k1 -i /home/wyl/.aspera/connect/etc/asperaweb_id_dsa.openssh --mode recv --host --user era-fasp --file-list id_trim.txt /mnt/sra
  13. rm id_trim.txt
  14. # 按Esc退出insert模式,按:wq保存退出vi编辑

x,y的抓取可以根据SRR号长度更改,主要要符合EBI的模式可以找到目标文件 

cut -b1-6        抓取字符串第1为到第6位

3. 下载

  1. # 在放置和的目录内运行
  2. sh