10.3969/j.issn.2095-2783.2015.06.002
基于位点相关概率模型的富亮氨酸重复序列预测
富亮氨酸重复序列(leucine-rich repeat,LRR)是一种广泛存在的蛋白质结构基序,在诸多重要生命过程中起关键性作用并与诸多人类疾病紧密相关.研究LRR中各个位点之间的氨基酸分布的相关性,并基于此相关性建立概率模型,可应用于序列水平上的LRR预测,以提高LRR预测的准确度.本文从LRRML数据库中提取已知的LRR蛋白质序列作为训练集和测试集;为LRR各个位点上氨基酸的分布数据构建4种不同的概率模型,包括位点相关和位点不相关概率模型;再通过机器学习和K-折交叉验证的方法,确定可以用于LRR预测的最佳模型.结果表明,位点相关概率模型和位点不相关概率模型以不同权重相加之后的综合模型在LRR预测中显示出高的准确度.LRR中各个位点之间的氨基酸分布存在一定的相关性,此相关性可作为重要参数应用于LRR预测.
生物信息学、富亮氨酸重复序列、序列算法、位点相关概率模型
10
TP391(计算技术、计算机技术)
高等学校博士学科点专项科研基金资助项目20110131120024,20110131120045
2015-06-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
626-628,637