核酸数据库
Genbank数据库=Nucleotide数据库
(一)基因序列注释内容解析
以dut基因编码的大肠杆菌酶dutpase为例;在Nucleotide数据库search X01714或者dutpase,检索链接https://www.ncbi.nlm.nih.gov/nuccore/x01714;得到以下信息。
1.Locus
Locus:编号 长度 分子类别 基因拓扑类型 更新日期
2.Definition
对dut基因的简单描述
3.Keywords
Keywords:可用于数据库检索
Source序列所属物种的俗名
Organism:对物种的详细介绍
4.Reference
Reference:物种的科学文献来源
5.Comment
Comment :*撰写内容,如致谢等
6.Features
Features,重要的注释内容,包括以下内容
- source:序列来源,克隆载体或者生物
- regulatory:区域作用,promotor启动子
- misc_feature:列出杂项区域,transcription start region 未证实的转录起始位置
- Ribosome-blinding site (RBS):核糖体结合位点, mRNA的起始AUG上游约8~13核苷酸处,存在一段由4~9个核苷酸组成的共有序列-AGGAGG-,可被16SrRNA通过碱基互补精确识别的序列。
- Coding segment CDS:有计算机根据翻译密码本自动翻译而来,中间翻译出来的蛋白质在各种蛋白质数据集中对应的检索号
- Origin:核酸序列
7.Graphics
Graphics:
编码两个蛋白质CAA258591和CAA258601;启动子位置;核糖体结合区位置;转录起始位置……这些特征注释于图上
8.导出基因序列与注释内容
Send to 可选Coding squences (只保存txt文件的编码基因序列)Complete Record(全部注释和序列内容)