编码序列和非编码序列的3-tuple分布特征
非编码序列,特别是内含子的起源,是一个重要的悬而未决的问题.首先通过计算模式生物的编码序列和非编码序列的不同阅读框中3-tuple的频率分布,发现编码区中不同阅读框具有十分不同的3-tuple分布,而在非编码区中,不同阅读框的3-tuple分布几乎相等,并且这一性质不具有物种依赖性.为了描述分布差异的程度,引进度量-对称相对熵,并通过比较原核生物和真核生物,发现无论是编码区还是非编码区,原核生物都具有比真核生物更高的SRE值.进一步研究表明,某一生物的SRE值与该生物全基因组中编码区所占的百分比存在一定.的相关性(相关系数为0.86).计算机模拟进化实验发现,2%的突变就足以使典型的原核生物编码区高SRE值变为真核生物内含子区特有的低SRE值.比对数据库中已经注释的内含子和编码区序列,证明确实有一部分与编码区具有很高同源性的内含子序列.实验表明,至少部分真核生物的内含子可能起源于编码序列,同时也说明SRE可能被用于研究物种基因组序列的进化.
基因组、对称相对熵、内含子、进化
32
Q751(分子遗传学)
科技部科研项目J99-A-03;国家自然科学基金30221120261,19971005,90208022
2005-12-01(万方平台首次上网日期,不代表论文的发表时间)
共9页
1018-1026