文件名称:MScDB:用于蛋白质组学的以质谱为中心的蛋白质序列数据库-开源
文件大小:101.8MB
文件格式:JAR
更新时间:2024-06-19 21:27:06
开源软件
蛋白质序列数据库是生命科学研究不可或缺的工具,包括基于质谱 (MS) 的蛋白质组学。 在当前的数据库构建过程中,序列相似性聚类被用于减少源数据中的冗余。 尽管功能强大,但它忽略了蛋白质组学数据以肽为中心的性质以及 MS 能够区分相似序列的事实。 因此,我们引入了一种方法,该方法使用来自大规模蛋白质组学数据的理论和经验信息在肽水平构建蛋白质序列空间,以生成以质谱为中心的蛋白质序列数据库 (MScDB)。 MScDB 的核心模块是 in-silico 蛋白水解消化和以肽为中心的聚类算法,该算法将质谱无法区分的蛋白质序列分组。