文件名称:论文研究-高通量DNA测序数据的多任务并行压缩算法.pdf
文件大小:848KB
文件格式:PDF
更新时间:2022-08-11 13:56:16
多任务并行,多线程,GPU,MIC,FastQ文件,压缩
研究采用任务并行的方法,对FastQ格式文件的压缩程序DSRC(DNA sequence reads compression)进行了加速。这一任务并行算法将DSRC分为数据读入和数据压缩两个独立的任务,而后将数据压缩的统计过程进一步细分为title行数据统计和其他数据统计两个独立任务。研究结合CPU多线程、GPU、MIC(many integrated core),针对title行数据设计了高并行度的统计算法,实现title行数据的并行统计。在维持原有压缩比的情况下,本研究得到的最大压缩通量可以达到144 MBps,最大加速比可达三倍。结果表明,多任务并行的方法可以有效地加速DSRC,而协处理器对DSRC的加速效果并不明显。另外本算法在压缩ILLUMINA和SOLiD测序平台下的FastQ数据时,其加速效果比压缩LS454测序平台的数据更为明显。