文件名称:metablastr:使用R进行大规模BLAST序列搜索
文件大小:365KB
文件格式:ZIP
更新时间:2024-06-12 03:51:59
protein species blast blast-searches nucleotide
异种细胞 一个易于使用的框架,可以使用R执行大规模序列搜索 动机 生物数据库中可用序列的数量呈指数增长,彻底改变了现代生命科学研究的方式。 目前,大约有十万种跨越生命之树的各种物种的基因组序列可公开获得并免费获得。 现在可以使用R包自动访问和检索此数据,下一步是利用大量的序列多样性来探索和检测可进化性,变异性和疾病出现的新颖模式。 R包解决了以标准化和计算可重现的方式检索大量生物序列数据的问题,而metablastr包旨在解决以标准化和计算可重现的方式进行大规模序列搜索的问题。 两种软件包, biomartr和metablastr都可以无缝互补,为用户提供了一个工具集,可自动检索数千个生物序列(成千上万的基因组,蛋白质组,注释等),并使用这些序列通过进行大规模序列搜索,从而提取大型物种之间相似性和差异性的新颖模式。 大规模进行序列搜索的最杰出的工具是基本局部比对搜索工具(BLAST)