文件名称:构建非冗余EID的若干技巧 (2009年)
文件大小:184KB
文件格式:PDF
更新时间:2024-05-27 08:42:57
自然科学 论文
基于GenBank构建的外显子内含子数据库(EID)含有大量的冗余数据.为了解决冗余问题,构建了基于RefSeq 的非冗余EID (non- redundant EID). RefSeq是由NCBI工作人员负责维护和更新的参考序列库,为基因组注释、基因识别、基因突变、多态性分析、表达研究和比对分析提供了重要的参考.该EID可用于大规模分析Exon /Intron结构和内含子剪切(Sp licing)的研究,并拥有一些内部机制来控制数据质量和可能出现的错误.同时,它的新的改进是增加了基因序列中非翻译区(UT