10.11896/j.issn.1002-137X.2014.09.046
一种基于互信息最大化的模型无关基因选择方法
针对大规模基因芯片高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于互信息最大化方法(MMI)和与遗传算法的模型无关的基因选择方法来将特征选择转化为全局优化问题,其中的适应度函数定义为类间距离与类内距离之比,适应程度高.为了评价算法的性能,采用3个数据集进行了实验,结果表明MMIGA-Selection取得了较好的效果,在每个数据集上获得了较高的5折交叉验证正确率.MMIGA-Selection主要有两个优点:一是可以有效减少冗余基因;二是模型无关性,选择得出的特征子集可直接用于其他类型的分类器,分类精度较高.
互信息最大化、模型无关、遗传算法、基因选择
41
TP181(自动化基础理论)
国家自然科学基金61272315,60842009,60905034;浙江省自然科学基金Y1110342,Y1080950;浙江省科技厅国际合作项目2012C24030
2014-11-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
243-247