基于机器学习的结直肠癌微卫星不稳定基因挖掘及其应用价值分析
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.7659/j.issn.1005-6947.2022.10.011

基于机器学习的结直肠癌微卫星不稳定基因挖掘及其应用价值分析

引用
背景与目的:结直肠癌(CRC)是全球第三大最常诊断的恶性肿瘤和第二大癌症死亡原因.最新指南推荐所有的CRC患者需要进行微卫星不稳定(MSI)的检测.MSI患者往往具有错配修复蛋白缺失(dMMR).MSI/dMMR状态已被用作生物标志物预测对免疫治疗的有利反应和预后.然而MSI特征基因及其与肿瘤浸润的免疫细胞的关系未进行阐述.因此本研究通过使用机器学习的方式发掘CRC中新型的MSI特征基因,并且验证其的诊断价值及其与免疫细胞浸润的关系.方法:按照纳入排除标准,将GEO数据库中GSE39582数据集作为训练集,将TCGA数据库中COAD数据集作为外部验证集.使用机器学习的方法(LASSO回归、SVM-RFE算法),在GSE39582结直肠癌数据集中筛选MSI特征基因,并在TCGA结直肠癌数据中进行验证.采用受试者工作特征(ROC)曲线和曲线下面积(AUC)评价基因对MSI的诊断效能.CIBERSORT算法评估肿瘤样本浸润的免疫细胞成分,Spearman相关性分析验证MSI特征基因和免疫细胞的关系.结果:训练集共纳入536例CRC患者,其中高频MSI(MSI-H)77例(14.37%).在验证集中,共计389例CRC患者,其中MSI-H67例(17.22%).基线资料分析显示,MSI-H/dMMR CRC的TNM分期存活率优于低频MSI(MSI-L)或微卫星稳定(MSS)/错配蛋白完整(pMMR)CRC(P<0.05).在GSE39582数据集中,LASSO回归筛选MSI特征基因21个,SVM-RFE算法筛选基因6个,结合两种算法确定MSI特征基因为 EIF5A、CXCL13、HNRNPL、HOXC6、RPL22L1、Y16709.在 TCGA 数据库中进一步验证MSI特征基因的诊断效能,研究发现EIF5A的诊断效能最高.在训练集和验证集中,EIF5A的AUC值分别为0.922和0.805.同时,Spearman相关性分析发现,EIF5A主要与CD8+T细胞,活化的树突状细胞,辅助性T细胞,M1型巨噬细胞,γδT细胞,中性粒细胞成正相关;与CD4+记忆性T细胞,M2型巨噬细胞,静止树突状细胞,嗜酸性粒细胞,调节性T细胞呈负相关.结论:CRC的新型MSI特征基因分析结果表明,EIF5A对CRC MSI的诊断具有较好的诊断作用和临床价值,同时提示EIF5A与免疫细胞及免疫微环境相关.因此,EIF5A可能成为免疫检查点治疗的新型标志物.

结直肠肿瘤、微卫星不稳定性、DNA错配修复、淋巴细胞、肿瘤浸润、机器学习

31

R735.3(肿瘤学)

国家自然科学基金82100680

2022-12-19(万方平台首次上网日期,不代表论文的发表时间)

共8页

1355-1362

相关文献
评论
暂无封面信息
查看本期封面目录

中国普通外科杂志

1005-6947

43-1213/R

31

2022,31(10)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn