10.3969/j.issn.1007-130X.2007.09.024
基于主成份分析的肿瘤分类检测算法研究
基于基因表达谱的肿瘤诊断方法有望成为临床医学上一种快速而有效的诊断方法,但由于基因表达数据存在维数过高、样本量很小以及噪音大等特点,使得提取与肿瘤有关的信息基因成为一件有挑战性的工作.因此,在分析了目前肿瘤分类检测所采用方法的基础上,本文提出了一种结合基因特征记分和主成份分析的混合特征抽取方法.实验表明,这种方法能够有效地提取分类特征信息,并在保持较高的肿瘤识别准确率的前提下大幅度地降低基因表达数据的维数,使得分类器性能得到很大提高.实验采用了两种与肿瘤有关的基因表达数据集来验证这种混合特征抽取方法的有效性,采用支持向量机的分类实验结果表明,所提出的混合方法不仅交叉验证识别准确率高而且分类结果能够可视化.对于结肠癌组织样本集,其交叉验证识别准确率高达95.16%;而对于急性白血病组织样本集,其交叉验证识别准确率高达100%.
支持向量机、基因表达谱、肿瘤分类、主成份分析
29
TP391(计算技术、计算机技术)
国家自然科学基金60233020
2007-10-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
84-90