乳腺癌发生的特征基因筛选及模式识别
本文选取癌症基因组图谱数据库的乳腺癌样本作为数据集,在全基因组的水平上研究乳腺癌病人从正常到发病Ⅰ期基因表达的变化,寻找与乳腺癌发病密切相关的特征基因,建立乳腺癌发生的模式识别分类方法,为乳腺癌预防及早期诊断提供理论支持.研究中,综合利用相关性、t检验、置信区间等统计学方法,建立乳腺癌发生特征基因筛选方法,获得与乳腺癌发生具有显著性差异的特征基因336个.通过机器学习方法建模,得到的分类准确率能达到98%以上,与之前乳腺癌相关的研究相比,准确率更高.同时采用KEGG (kyoto encyclopedia of genes and genomes)通路分析得到与基因显著相关(P<0.05)的通路有8个,GO(gene ontology)基因功能富集分析显示与基因显著相关(P<0.05)的功能有18个.最后对映射在8个通路中的一部分基因进行简要功能分析,说明了其在调控水平上的密切关系,表明识别的特征基因在乳腺癌的发生过程中有重要的作用,这对了解乳腺癌发病机理以及乳腺癌的早期诊断非常重要.
乳腺癌、基因表达、模式识别、肿瘤预测、早期诊断
44
R73;R3
国家自然科学基金11572014;智能制造领域大科研推进计划01500054631751资助项目.This work was supported by grants from The National Natural Science Foundation of China11572014;Major Research Projects in The Field of Intelligent Manufacturing01500054631751
2017-12-21(万方平台首次上网日期,不代表论文的发表时间)
共10页
1016-1025