基于XGBoost的COVID-19患者重症风险早期预测模型的建立与评价

WANG Ming, CHENG Zhenhao, HU Miao, TANG Mingcheng,XU Fumin,WANG Li,NIAN Yongjian,LIU Kaijun

Journal of third military medical university(2022)

引用 0|浏览6
暂无评分
摘要
目的 利用新型冠状病毒病(corona virus disease 2019,COVID-19)患者的临床特征数据构建XGBoost预测模型,并评价预测模型对COVID-19患者重症进展风险早期预测的效能.方法 对2020年2月10日至4月5日火神山医院病案系统内经实验室确诊的COVID-19患者进行筛选,共收集347例有完整医疗信息和实验室检查结果的患者数据.首先筛选出21个具有显著性差异的指标作为训练模型的输入特征;对构建的XGBoost模型进行贝叶斯优化以调整参数,并基于特征重要性筛选出最优特征组合;进一步分析各特征数值大小对预测结果的正负影响,利用SHAP(SHapley Additive exPlanation)对各特征重要性进行量化和归因;对XGBoost预测模型进行性能评价,并将其与其他机器学习方法进行对比,讨论其优势所在.结果 本研究选取21个重症组与非重症组差异显著的特征进行训练和验证.在K最邻近(k-nearest neighbor,KNN)模型中具有10个特征的最优子集获得了验证集中4个模型中曲线下面积(area under curve,AUC)值的最高值.年龄、脉率、白细胞计数、中性粒细胞计数、C-反应蛋白、总胆红素、肌酐、D-二聚体(D-Dimer)越高,疾病重症风险越高;淋巴细胞计数、白蛋白水平越低,疾病重症风险越高.XGBoost与支持向量机的预测性能优于其他机器学习方法(在测试集上AUC值分别为0.9420、0.9594),其中XGBoost训练速度明显更优.结论 基于XGBoost成功建立了预测模型,以最优特征子集实现了对COVID-19患者重症进展风险的早期预测.
更多
查看译文
关键词
xgboost,early prediction model,disease progression
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要