10.3969/j.issn.1002-137X.2006.06.054
基于EM的隐马氏过程随机迭代算法及其在生物序列启动子识别中的应用
随着后基因组时代的到来,如何去揭示序列背后隐藏的生命信息已成为当前生命科学探讨的主题.而控制基因表达的正是启动子序列,如何去识别和预测序列的启动子区域是基因研究的重点课题.隐马尔可夫模型是最近几年研究基因最主要的模型.本文首先探讨了EM算法并提出了随机迭代算法,在初始状态分布和散发矩阵都随机假设,而转移矩阵由序列计算出的条件下对人类启动子序列进行识别,平均识别率达到了92.05%.改进了多分类问题中的"投票策略",提出了"一票决定"算法,使算法次数由O(N2)降到了O(N),由此对多个DNA家族进行分类,正确率达90.73%.从结果上看,在两类问题上,支持向量机比隐马尔可夫模型优越,但在处理多分类问题上隐马尔可夫模型却比支持向量机有更强的分类能力.
隐马尔可夫模型、随机迭代算法、"一票决定"算法、启动子的识别和分类
33
TP3(计算技术、计算机技术)
国家自然科学基金10371135
2006-09-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
195-199