10.3969/j.issn.0258-8021.2011.05.010
基于PTPR排名的基因随机选择算法
面对高维、小样本的基因微阵列数据,有效地提取特征基因成为一项艰巨的任务.在随机特征选择方法的基础上,引入“种子变量”及滚动的排名机制,提出一种基于职业网球选手排名(PTPR)的特征选择算法.用种子变量提高变量搜索过程的选择性,提高搜索效率,同时充分利用历史记录来动态更新种子变量,加快寻优速度.在公共数据库上的测试实验结果表明,PTPR在随机多次独立运行时得到平均50% ~ 80%的相同基因,而MichalDraminski的方法只能保持相同基因在10% ~50%左右;收敛性实验表明,PTPR的收敛速度更快且显著;而在5个数据集的独立测试集上的分类率实验表明,PTPR保持较高的分类率,如PTPR得到最高分类率大约为98%、90%、89%、95%、75%,而Michal Draminski方法的最高分类率为96%、89%、85%、95%、70%.同时,与其他典型方法相比,PTPR也得到了较高的分类率.总体上,PTPR算法具有搜索速度快、结果稳定的特点,而且在不同的分类器上都保持了较优的分类率.
PTPR、特征选择、种子变量、随机搜索、滚动的排名
R318(医用一般科学)
国家杰出青年基金60788101;国家自然科学基金60801055,60801054;浙江省自然科学基金Z2090299
2011-12-13(万方平台首次上网日期,不代表论文的发表时间)
共11页
695-705