10.7659/j.issn.1005-6947.2021.11.009
基于公共数据库的甲状腺癌预后风险基因筛选
背景与目的:甲状腺癌的发病率呈逐年增长趋势,尽管其总体预后较好,但仍有部分患者因复发或转移而死亡.本研究旨在基于公共数据库应用生物信息学方法筛选甲状腺癌的预后风险基因.方法:从癌症RNA测序关系(CRN)数据库下载甲状腺癌的蛋白编码基因RNA-seq数据,筛选甲状腺癌中差异表达的蛋白编码基因.通过DAVID数据库对差异表达的蛋白编码基因进行功能富集分析.用STRING数据库和Cytoscape软件构建差异表达蛋白编码基因之间的相互作用网络,分别用Cytoscape软件中的cytoHubba插件与ClueGO插件筛选核心基因,并对核心基因进行功能预测.用UALCAN数据库验证核心基因在甲状腺癌中的表达水平,通过GEPIA数据库对核心基因进行生存分析,分析核心基因的表达水平对甲状腺癌的生存时间有无影响.结果:筛选共得到913个差异表达的蛋白编码基因.这些基因主要富集于调控小分子GTP酶介导的信号转导、Z膜、结合肌动蛋白和细胞色素P450介导的药物代谢.构建互作网络后,筛选出10个核心基因,分别为TP53、ESR1、FOS、SYP、PPARG、ACTB、GRIA1、NRXN1、HDAC3和KIT,其中TP53得分最高,为62,它们均在甲状腺癌组织中表达下调;预测显示核心基因TP53、ESR1、PPARG可能参与了基因沉默的负性调控,TP53、FOS可能参与了RNA聚合酶Ⅱ对pri-miRNA的转录调控过程.UALCAN数据库验证结果显示,除TP53外,其余核心基因均在甲状腺癌组织中表达下调(均P<0.05),与CRN数据库中的表达结果一致.生存分析结果显示,KIT的高表达与甲状腺癌患者的无病生存期明显相关(P=0.012),而对其总体生存期无明显影响(P=0.85).结论:本研究筛选的蛋白编码基因KIT在甲状腺癌组织中呈低表达,其高表达与甲状腺癌的无病生存期密切相关,推测其可能成为甲状腺癌的预后风险标志物或治疗靶点.
甲状腺肿瘤;基因表达谱;预后;计算生物学
30
R736.1(肿瘤学)
湖南省长沙市科技计划基金资助项目;湖南省教育厅优秀青年基金资助项目
2022-01-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
1334-1342