10.3969/j.issn.1004-616x.2023.05.008
生物信息学分析食管癌关键基因的表达及其临床意义
目的:采用生物信息学技术,从基因表达综合数据库(GEO)中挖掘食管癌(ESCA)异常表达基因,探讨该基因在食管癌中的表达及临床意义.方法:用R语言中的GEOquery包从GEO数据库中下载ESCA芯片数据集GSE38129、GSE20347,经sva包对数据集去除批次效应后,使用Limma包对标准化数据集进行差异表达基因(DEGs)筛选,利用clusterProfiler包对DEGs进行基因本体(GO)功能富集分析和京都基因与基因组百科全书(KEGG)通路富集分析,在STRING网站对DEGs进行蛋白互作网络分析(PPI),利用MCODE和CytoHubba插件提取核心模块及核心基因(Hub gene).在阿拉巴马伯明翰分校癌症数据库(UALCAN)输入Hub gene分析其表达水平与食管癌分期、甲基化水平及TP53突变等的关系,最后借助芯片数据GSE70409对核心基因进行验证.结果:在标准化数据集中筛选出390个DEGs,其中上调166个,下调224个.GO分析得出,它们主要参与有丝分裂细胞周期相变、细胞外基质生成、表皮发育等生物学过程.KEGG富集分析显示DEGs与细胞周期、细胞外基质受体相互作用、阿米巴病等信号通路相关.得到的PPI输入Cytoscape软件,共筛选出20个关键基因.关键基因输入UALCAN数据库分析,筛选出3个基因(CDK1、TOP2A、AURKA)mRNA表达水平在食管癌中显著高于正常组织(P<0.05),且这3个基因与食管癌临床分期、TP53突变率、该基因启动子甲基化水平呈正相关(P<0.05).这3个基因的表达率在男性患者中均显著高于女性患者(P<0.05),41~60岁的患者的表达率明显高于其他年龄段(P<0.05).通过基因表达谱交互式分析(GEPIA)数据库Kaplan-Meier生存曲线分析,CDK1和AURKA基因高表达的ESCA患者总生存期比低表达者短(P=0.036和P=0.033),因此CDK1和AURKA基因表达与食管癌预后负相关.结论:综合应用生物信息学技术,最终筛选出3个核心基因,在食管癌中表达高于正常组织.CDK1、TOP2A、AURKA的表达与肿瘤分期、该基因启动子甲基化水平和TP53突变状态正相关;其中CDK1、AURKA有可能成为食管癌临床诊断和预后判断的一种新的分子标志物.
食管癌、生物信息学、基因表达综合数据库、差异表达基因
35
R730.2(肿瘤学)
厦门市医疗卫生科技计划项目;厦门市医疗卫生指导性项目
2023-10-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
374-381