10.3969/j.issn.1673-4785.2008.01.013
半监督多标记学习的基因功能分析
传统的机器学习主要解决单标记学习,即一个样本仅有一个标记.在生物信息学中,一个基因通常至少具有一个功能,即至少具有一个标记,与传统学习方法相比,多标记学习能更有效地识别生物相关基因组的功能.目前的研究主要集中在监督多标记学习算法.然而,研究半监督多标记学习算法,从已标记和未标记的基因表达数据中学习,仍然是未解决问题.提出一种有效的基因功能分析的半监督多标记学习算法SML_SVM.首先,SML_SVM根据PT4方法,将半监督多标记学习问题转化为半监督单标记学习问题,然后根据最大后验概率原则(MAP)和K近邻方法估计未标记样本的标记,最后,用SVM求解单标记学习问题.在yeast基因数据和genbase蛋白质数据上的实验表明,SML_SVM性能比基于PT4方法的MLSVM和自训练MLSVM更优.
半监督、多标记、自训练、支持向量机
3
TP181(自动化基础理论)
国家高技术研究发展计划863计划2006AA10Z313;国家自然科学基金60773206/F020106;60704047/F030304;国防应用基础研究基金A1420461266;教育部跨世纪优秀人才支持计划NCET-04-0496;教育部科学技术基金105087
2008-05-20(万方平台首次上网日期,不代表论文的发表时间)
共8页
83-90