NCBI Genbank核苷酸序列数据库检索基因序列解读

时间:2024-04-04 19:09:43

核酸数据库

Genbank数据库=Nucleotide数据库

(一)基因序列注释内容解析

以dut基因编码的大肠杆菌酶dutpase为例;在Nucleotide数据库search X01714或者dutpase,检索链接https://www.ncbi.nlm.nih.gov/nuccore/x01714;得到以下信息。

1.Locus

NCBI Genbank核苷酸序列数据库检索基因序列解读

Locus:编号 长度 分子类别 基因拓扑类型 更新日期

2.Definition

NCBI Genbank核苷酸序列数据库检索基因序列解读

对dut基因的简单描述

3.Keywords

NCBI Genbank核苷酸序列数据库检索基因序列解读

Keywords:可用于数据库检索

NCBI Genbank核苷酸序列数据库检索基因序列解读

Source序列所属物种的俗名

Organism:对物种的详细介绍

4.Reference

NCBI Genbank核苷酸序列数据库检索基因序列解读

Reference:物种的科学文献来源

5.Comment

NCBI Genbank核苷酸序列数据库检索基因序列解读

Comment :*撰写内容,如致谢等

6.Features

NCBI Genbank核苷酸序列数据库检索基因序列解读

Features,重要的注释内容,包括以下内容

  1. source:序列来源,克隆载体或者生物
  2. regulatory:区域作用,promotor启动子
  3. misc_feature:列出杂项区域,transcription start region 未证实的转录起始位置
  4. Ribosome-blinding site (RBS):核糖体结合位点, mRNA的起始AUG上游约8~13核苷酸处,存在一段由4~9个核苷酸组成的共有序列-AGGAGG-,可被16SrRNA通过碱基互补精确识别的序列

NCBI Genbank核苷酸序列数据库检索基因序列解读

  1. Coding segment CDS:有计算机根据翻译密码本自动翻译而来,中间翻译出来的蛋白质在各种蛋白质数据集中对应的检索号
  2. Origin:核酸序列

7.Graphics

NCBI Genbank核苷酸序列数据库检索基因序列解读

NCBI Genbank核苷酸序列数据库检索基因序列解读

Graphics:

编码两个蛋白质CAA258591和CAA258601;启动子位置;核糖体结合区位置;转录起始位置……这些特征注释于图上

8.导出基因序列与注释内容

Send to 可选Coding squences (只保存txt文件的编码基因序列)Complete Record(全部注释和序列内容)