10.3969/j.issn.0258-8021.2013.01.003
运用近邻传播聚类分析进行SELDI-TOF蛋白质谱特征选择
针对如何有效分析高通量SELDI-TOF质谱数据以及筛选与肿瘤相关的蛋白质位点,提出一种基于近邻传播聚类分析的特征选择方法.首先利用t-test对SELDI数据进行初筛,然后利用近邻传播聚类分析以及零空间LDA对数据进行降维和去相关处理,最后采用SVM-RFE进行特征选择,筛选出与肿瘤判别相关的蛋白质位点.利用SVM、KNN、NB及J4.8等4个分类器,估算算法的分类性能.结果表明,在卵巢癌公共数据集OC-WCX2a和OC-WCX2b以及浙江省肿瘤医院乳腺癌数据集BC-WCX2a上显示该算法,在上述3个数据集中分类率分别达到96.43%、99.66%、90.88%,敏感性分别达到97.00%、100%、96.17%,特异性分别达到95.85%、99.08%、81.92%,并分别挑选出与肿瘤判别相关的10个蛋白位点.所提出的算法能够获得较好的分类率,有效提取出具有较好判别效果的蛋白质谱位点,有助于癌症的辅助诊断.
蛋白质质谱、近邻传播聚类分析、特征选择、生物标志物
32
R318(医用一般科学)
国家自然科学基金60801054,60801055;国家杰出青年基金60788101
2013-05-03(万方平台首次上网日期,不代表论文的发表时间)
共7页
14-20