基于机器学习算法筛选鼻咽癌诊断基因标志物的研究
目的 基于最小绝对收缩和选择算子(LASSO)算法与支持向量机递归特征消除(SVM-RFE)算法筛选用于鼻咽癌(NPC)诊断的特征基因标志物.方法 从GEO数据库下载基因表达微阵列数据集GSE53819、GSE13597作为训练集,从GTEx数据库、ICGC数据库分别下载转录组测序数据集GTEx-NPC、ICGC-NPC作为训练集、验证集.通过基因表达差异分析筛选NPC相关差异表达基因(DEGs),再通过LASSO算法和SVM-RFE算法分别筛选3个训练集中的NPC诊断特征基因.结合外部验证集,通过受试者工作特征(ROC)曲线的曲线下面积(AUC)评估特征基因对NPC的诊断效能.结果 本研究共筛选出582个NPC相关DEGs,包括156个高表达DEGs和426个低表达DEGs;基于LASSO算法与SVM-RFE算法,GSE53819、GSE13597、GTEx-NPC数据集均筛选出3个关键诊断特征基因HOXA10、AFF3、SHISA3,且GTEx-NPC数据集另有1个特征基因PLAU;ROC曲线分析结果显示,特征基因HOXA10、AFF3、SHISA3、PLAU在各数据集中诊断NPC的AUC均大于0.7,具有良好的诊断效能.结论 基于LASSO算法和SVM-RFE算法可筛选出4个潜在的NPC诊断特征基因标志物,且外部验证结果显示这些基因标志物在诊断NPC方面具有良好效能,这为NPC的早期诊断和相关基因的分子机制研究提供了有价值的参考.
鼻咽癌、基因组学、机器学习、生物信息学、支持向量机递归特征消除、套索回归
27
R739.62;R446(肿瘤学)
四川省科技计划联合创新专项资助项目;四川省医学科研课题;四川省泸州市人民政府-西南医科大学科技战略合作项目;西南医科大学创新创业训练计划项目
2023-06-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
6-11