最简单直接粗暴的Mothur分析OTU教程
废话不多说,首先你需要下载Mothur,直接百度去官网下载
第一步:准备需要分析OTU的序列文件(fasta格式)
一般通过载体连接、大肠杆菌克隆、测序得到的16S rRNA序列两侧是有引物的,不管你用的是不是1492r和27f。在这一步你需要做的事是:
1. 把所有序列放在一个fasta文件夹中;
2. Align一下让它们对齐(Bioedit、MEGA随便什么可以align的软件随你用)(虽然Mothur也可以用来对齐但是非常TM不好用,直接用别的软件更加直观!)
3. 保证它们的方向一致
(方向不一致即使你两条序列相似性99%Mothur也会把它们分到不同的OTU)
(直接align完以后看一下序列两端引物是不是同一个,不是就直接Reverse Complement)
(reverse complement以后就会发现序列首尾都是引物了,要是对的不齐就再align一下)
(完事了输出fasta格式的序列文件,这就算准备好了)
第二步:计算OTU
1. 把你准备的fasta文件放到mothur.exe所在的文件夹下,双击mothur.exe
2. 运行指令dist.seqs(fasta=example.fasta,cutoff=0.03,output=square),输出 example.square.dist文件
这一步是要计算距离矩阵,fasta就是你的序列文件,cutoff是OTU分类的阈值(0.03意味着相似性大于97%是一个OTU),output是输出距离矩阵的形状(square是矩形,还可以是三角形)
这一步其实还可以设置其他的参数包括罚分方式、计算方式等,但是默认的其实就可以了,如果你有特殊要求自己去Mothur官网看。
3. 运行指令cluster(phylip=example.square.dist,cutoff=0.03),输出文件example.square.opti_mcc.list文件
这一步是将距离矩阵聚类,可以选择method,默认是furthest,有特殊需要自己去看官网
4. 运行指令bin.seqs(list=example.square.opti_mcc.list,fasta=example.fasta),输出example.square.opti_mcc.0.03.fasta
用记事本打开这个fasta文件就看到OTU已经分好了
5. 运行get.oturep(phylip=example.square.dist,list=example.square.opti_mcc.list),输出example.square.opti_mcc.0.03.rep.names
这个步骤就是把每个OTU的代表序列挑选出来
最左侧是每个OTU的代表序列名称,右侧是对应的OTU内包含的所有序列名称
(自学的,不对的地方可以友好交流,一起进步,靴靴)