基于一种新的基团编码的蛋白质二级结构预测
提出一种新的氨基酸编码方式,即基团编码,基团编码是对20种氨基酸进行的编码方式,含有42个属性,然后采用这种新的编码方式进行蛋白质二级结构预测.所有的氨基酸都可以有这几种基团来表示,这种基团编码方式中包含氨基酸或蛋白质中原子稳定结构的信息.实验中采用3折交叉验证,分别采用不同的滑动窗口数,通过支持向量机(SVM)来进行蛋白质二级结构预测,验证2组数据的准确率,可以发现氨基酸的不同的编码方式对预测精度会产生影响.经过实验对比,包含氨基酸内部稳定结构信息的基团编码方式的准确率比正交编码要高出1.2%.
蛋白质二级结构预测、基团编码、正交编码、SVM
7
TP391(计算技术、计算机技术)
国家自然科学基金61375013;山东省自然科学基金ZR2013FM020
2017-08-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
13-16,20