模式生物基因序列的识别* (2005年)

时间:2024-06-07 19:40:57
【文件属性】:

文件名称:模式生物基因序列的识别* (2005年)

文件大小:359KB

文件格式:PDF

更新时间:2024-06-07 19:40:57

自然科学 论文

真核生物的全基因组序列可分为三种:外显子、内含子和基因间序列。基于剪切位点附近序列的保守性,序列的组分特征和编码序列阅读框存在三周期性,三种序列的标准离散源由序列上64个三联体的概率和5’端与3’尾剪切位点附近(共30位点)上4个碱基的概率,共184个参数构成。某条序列的类型就可以由该序列的离散量与上面三个标准离散源的离散量之间的离散增量最小值决定。当标准离散源具有184个信息参数时预测率比64参数预测的成功率至少提高4.61%,前者的预测成功率依次如下:线虫88.37%,酵母菌90.72%,拟南芥91.


网友评论