10.3969/j.issn.2095-2163.2012.04.008
植物抗性基因识别中样本选择的一种新方法
植物抗性基因识别中的从头预测方法可以看作机器学习中的分类问题.通常情况下,一个分类器的训练需要正确标记的正例和反例.然而,抗性基因识别中可用的信息仅有少数人工标记的抗性基因,且不具有抗性功能的基因也不明确.为了消除由于正例太少和错误的反例带来的抗性基因识别的影响,基于抗性基因和其他基因在蛋白质相互作用网中的距离,提出了一种新的样本选择方法,并对提出的样本选择方法和通常样本选择方法分别在四种分类器上进行了10倍交叉验证.结果表明,文中方法的SN值平均提高了6.9%,SP值平均提高了13.1%.因此,就敏感性和特异性而言,提出的方法获得了更高效、更可靠的结果.
样本选择、植物抗性基因、分类
2
TP391(计算技术、计算机技术)
国家自然科学基金60932008,61172098;高等学校博士学科点专项科研基金20112302110040;中央高校基本科研业务费专项资金HIT.ICRST.2010022
2012-11-01(万方平台首次上网日期,不代表论文的发表时间)
共4页
31-34