10.3760/cma.j.cn371439-20221214-00043
预测浆液性卵巢癌术后复发远处转移风险机器学习模型的构建
目的:利用常规临床数据开发浆液性卵巢癌(SOC)术后复发远处转移风险机器学习预测模型。方法:收集2010年1月至2020年12月在云南省肿瘤医院行手术治疗后复发的687例SOC患者为研究对象。根据复发状态将患者分为远处转移组(
n=105)及非远处转移组(
n=582)。采用logistic回归筛选SOC远处转移相关变量,运用K最近邻(KNN)、逻辑回归(LR)、随机森林(RF)、支持向量机(SVM)和极限梯度提升(XGBoost)5种机器学习算法开发SOC术后复发远处转移风险预测模型。在模型验证方面,采用十折交叉验证方法进行内部验证。模型的性能使用受试者工作特征曲线评估。
结果:远处转移组与非远处转移组患者国际妇产科联盟(FIGO)分期(
Z=-3.81,
P<0.001)、围手术期化疗周期(
t=-5.11,
P<0.001)、淋巴结转移(
χ2=5.98,
P=0.014)、腹腔积液细胞学(
Z=-2.22,
P=0.026)、新辅助化疗(
χ2=5.29,
P=0.021)差异均具有统计学意义。多因素分析结果显示,FIGO分期(
OR=1.54,95%
CI为1.07~2.22,
P=0.019)和围手术期化疗周期(
OR=1.22,95%
CI为0.09~0.36,
P<0.001)是SOC术后复发时发生远处转移的独立影响因素。腹腔积液细胞学(
OR=1.20,95%
CI为0.71~1.89,
P=0.180)不是SOC远处转移的独立影响因素,结合文献观点将其纳入后可提高模型的曲线下面积(AUC),最终将其纳入模型的构建。基于上述3个变量构建的5个机器学习模型中,基于KNN构建的模型识别SOC远处转移的性能最佳,AUC为0.750、敏感性为0.591、特异性为0.786、准确率为85.0%;LR模型的AUC为0.679、敏感性为0.545、特异性为0.765、准确率为84.3%;SVM模型的AUC为0.634、敏感性0.240、特异性为0.968、准确率为84.7%;RF模型的AUC为0.575、敏感性0.905、特异性为0.245、准确率为84.7%;XGBoost模型的AUC为0.704、敏感性0.567、特异性为0.745、准确率为84.9%。
结论:FIGO分期、围手术期化疗周期为SOC术后发生远处转移的独立影响因素;基于FIGO分期、围手术期化疗周期及腹腔积液细胞学构建的KNN模型预测SOC术后复发远处转移具有较高的区分度与准确率。
卵巢肿瘤、复发、肿瘤转移、机器学习、危险因素
50
2023-07-11(万方平台首次上网日期,不代表论文的发表时间)
共7页
220-226