10.3969/j.issn.1672-5565.2013.01.12
基于SVM和平均影响值的人肿瘤信息基因提取
基于基因表达谱的肿瘤分类信息基因选取是发现肿瘤特异表达基因、探索肿瘤基因表达模式的重要手段.借助由基因表达谱获得的分类信息进行肿瘤诊断是当今生物信息学领域中的一个重要研究方向,有望成为临床医学上一种快速而有效的肿瘤分子诊断方法.鉴于肿瘤基因表达谱样本数据维数高、样本量小以及噪音大等特点,提出一种结合支持向量机应用平均影响值来寻找肿瘤信息基因的算法,其优点是能够搜索到基因数量尽可能少而分类能力尽可能强的多个信息基因子集.采用二分类肿瘤数据集验证算法的可行性和有效性,对于结肠癌样本集,只需3个基因就能获得100%的留一法交叉验证识别准确率.为避免样本集的不同划分对分类性能的影响,进一步采用全折交叉验证方法来评估各信息基因子集的分类性能,优选出更可靠的信息基因子集.与基它肿瘤分类方法相比,实验结果在信息基因数量以及分类性能方面具有明显的优势.
基因表达谱、秩和检验、支持向量机、平均影响值、全折交叉验证
11
Q811.4(生物工程学(生物技术))
国家自然科学基金项目11261066;云南省应用基础研究资助项目2007A023M;云南省教育厅科学研究项目2012Y497
2013-07-03(万方平台首次上网日期,不代表论文的发表时间)
共7页
72-78