基于WGCNA和SVM-RFE算法挖掘肺腺癌诊断和预后基因标志物
目的 肺癌是世界上最常见的癌症之一,在众多肺癌患者中,肺腺癌(lung adenocarcinoma,LUAD)的死亡率最高.基因表达谱的变化与肿瘤的发生和发展过程有关,通过识别与LUAD患者相关的诊断和预后基因标志物,可以为肺腺癌的预防和治疗提供理论依据.方法 本研究以肿瘤基因组图谱(The Cancer Gene Atlas,TCGA)数据库为基础,采用加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)、差异基因分析、coX回归分析、蛋白质互作网络(protein-protein interaction,PPI)分析等方法筛选与LUAD形成过程高度相关的hub基因.将TCGA和基因型组织表达(GTEx genotype tissue expression,GTEx)数据库中的RNA数据合并划分为训练集和内部验证集,利用基于支持向量机的递归特征消除算法(support vector machine recursive feature elimination feature,SVM-RFE)构建诊断模型并进行验证.GSE32863和GSE31210数据集分别用于验证诊断模型的准确性和基因标志物的预后价值.结果 SVM-RFE算法得到的5个基因标志物(anln、cenpa、plk1、tpx2、cdca3)模型在LUAD患者分类中具有显著的诊断能力.功能富集分析表明,这5个基因与肿瘤发生发展的生物学过程密切相关.此外,这5个基因高表达的LUAD患者的预后表现不良,死亡率显著高于低表达的患者.结论 我们的研究为LUAD的诊断和预后提供了具有5个基因特征的模型,这对于开发用于精确治疗的新靶点具有重要意义.
肺腺癌;基因标志物;加权基因共表达网络分析;递归特征消除算法
49
R735.7;R318.04(肿瘤学)
2022-03-25(万方平台首次上网日期,不代表论文的发表时间)
共14页
381-394