蛋白序列相似度比对可以得到蛋白相似度信息,以及分析同源蛋白在进化过程中的序列保守型,预测可能存在蛋白结构域。
获得蛋白序列
氨基酸序列的获取可以直接通过 cDNA翻译,也可以直接从Uniport上直接获取氨基酸序列。
以拟南芥中FLS家族中的FLS1,FLS3,FLS4,FLS5,FLS6五个基因(FLS2明显不一样)为例:
直接搜索FLS1,即可得到下面页面:
很明显,第一个就是想要的蛋白。直接点击Entry下面的链接进入。
如果觉得结果看的不清楚,还可以在左下角输入框中输入Arabidopsis Thaliana(拟南芥的英文名)进一步筛选想要的蛋白。
点击左侧的Sequence
然后点击页面上方的FASTA即可得到蛋白的序列,复制蛋白序列
CLUSTALW进行比对
打开CLUSTALW,在搜索框中粘贴刚刚复制的序列(记得标上基因名称):
同样的方式获取其他几个蛋白的氨基酸序列,然后按照一样的方式粘贴在之前序列的后面(记得在序列前面加上蛋白的名字)
然后点击页面左下角的‘Execute Multiple Alignment’按钮,然后就得到结果了。
点击页面上的‘clustalw.aln’,即可下载比对结果
打开文件,其实就是上图下方的比对信息。
ESPript 3上查看比对结果
我们也可以放到expript上去查看。
在页面中间的Aligned Sequences模块点击‘选择文件’按钮,将之前下载下来的clustalw.aln文件进行上传,然后点击页面左上角的‘SUBMIT’按钮提交。
弹出的弹窗会给出结果,点击pdf结果,如下图:
这就可以直观的查看比对结果了。pdf文件也可以直接保存下来使用。