10.7659/j.issn.1005-6947.2018.09.007
基于生物信息学的胰腺导管腺癌预后风险长链非编码RNA筛选
目的:应用生物信息学方法筛选胰腺导管腺癌的预后风险长链非编码RNA(lncRNA).方法:从癌症和肿瘤基因图谱(TCGA)数据库下载胰腺导管腺癌患者的RNA-seq Level 2数据及其临床信息.根据NCBI Gene数据库及GENCODE v7数据库的基因注释信息,将下载的mRNA和lncRNA测序数据进行重新注释.然后应用R软件的edgeR包和limma包筛选差异表达的mRNA和lncRNA,并对它们进行相关性分析,进而获得lncRNA-mRNA有统计学意义的共表达关系对,并将其中的mRNA定义为lncRNA的靶基因.通过R软件clusterProfiler包对lncRNA的靶基因进行功能富集分析,以推测lncRNA的生物学功能.最后,绘制差异表达lncRNA的Kaplan-Meier曲线,筛选出与胰腺导管腺癌预后风险相关的lncRNA.结果:经过基因重新注释,共得到19791个mRNA和1623个lncRNA的测序数据,随后共筛选得到260个差异表达的mRNA和15个差异表达的lncRNA.经过相关性分析,共得到包括5个lncRNA和24个mRNA在内的24个有统计学意义的共表达关系对.其中lncRNA LINC00857有6个靶基因,分别为C1orf116、ESRP1、GPRC5A、LIPH、MAL2和PLS1.根据lncRNA靶基因的功能富集分析,推测LINC00857主要富集于磷脂酶活性、细胞骨架结构组成和脂肪酶活性.生存分析发现,CASC8和LINC00857与胰腺导管腺癌的预后风险明显有关(P=0.0052、P=0.027).结论:CASC8和LINC00857可能是胰腺导管腺癌的预后风险lncRNA,有望在今后的研究中成为胰腺导管腺癌新的预后监测指标.
胰腺肿瘤、癌、导管、RNA、长链非编码、生物标记、肿瘤、计算生物学
27
R735.9(肿瘤学)
湖南省自然科学基金资助项目2017JJ3508
2018-10-19(万方平台首次上网日期,不代表论文的发表时间)
共9页
1126-1134