
8.8 Q1|河北医科大学机器学习发文 | 可解释性机器学习模型用于危重患者新发房颤预测的多中心研究

1.第一段–文章基本信息
文章题目:Interpretable machine learning model for new-onset atrial fibrillation prediction in critically ill patients: a multi-center study
中文标题:可解释性机器学习模型用于危重患者新发房颤预测的多中心研究
发表杂志:Critical Care
影响因子:1区,IF= 8.8
发表时间:2024年10月
2.第二段–研究思路
本研究思路
本文旨在开发并验证一种用于预测危重病患者新发房颤(NOAF)风险的机器学习模型。研究使用了来自MIMIC数据库的两个非重叠数据集:MIMIC-IV用于模型训练,MIMIC-III的子集用于外部验证。研究纳入了18岁以上、ICU住院超过两天且无房颤病史的患者。通过LASSO回归筛选出23个与NOAF相关的变量,包括年龄、机械通气、尿量、败血症等。研究使用了8种机器学习算法构建预测模型,其中XGBoost模型表现最佳,验证集AUC为0.891,外部验证集AUC为0.769。研究还利用SHapley Additive exPlanations(SHAP)方法对模型进行可视化解释,揭示了关键预测因素对模型的贡献。最终,研究开发了一个用户友好的界面,供临床医生使用,以帮助及时识别高风险患者并改善预后。
3.第三段-Introdction
背景
新发房颤(NOAF)是指既往无房颤病史的患者出现房颤。在房颤发作期间,心房功能丧失和心室率增加会导致心输出量下降和血流动力学紊乱。NOAF是重症监护病房(ICU)中危重病患者最常见的心律失常,其发生率在不同研究中差异较大,范围从1.7%到43.9%。研究表明,在脓毒症休克患者中,NOAF的存在是疾病严重程度的标志,并代表了额外的器官衰竭。此外,多项研究显示,危重病期间的NOAF与中风、心力衰竭以及短期和长期死亡风险增加密切相关。尽管已有研究关注心脏手术后的NOAF,但对未接受心脏手术的危重病患者的NOAF研究相对较少。在临床实践中,大多数发展为NOAF的危重病患者是感染或其他非心脏疾病的患者,这些患者往往未能及时获得心血管专家的专门干预。这种护理缺口凸显了在常规ICU环境中早期识别高危患者的紧迫性,并探索潜在的针对性干预措施。
4.第四段-Methods
方法
数据来源
用于构建模型的数据来自医学信息市场(MIMIC)数据库的第IV版(MIMIC-IV,版本:v2.2),该数据库包含了2008年至2020年期间,贝斯以色列迪卡内斯医疗中心收治的299,712名患者的431,231次住院信息。此外,我们还使用了MIMIC-III数据库的一个子集进行外部验证,该子集包括2001年至2008年期间23,692名患者的26,836次住院记录,且与MIMIC-IV的患者无重叠。本文的通讯作者(Bing Xiao)通过了协作机构培训计划(CITI)考试并获得了证书(记录编号:57,440,109)。由于MIMIC数据库已经脱敏,因此无需从患者处获取知情同意。我们向医院伦理委员会进行了口头报告,无需经过常规审批流程。
研究对象
纳入研究的患者需满足以下标准:(1)年龄超过18岁;(2)ICU住院时间超过两天;(3)在入院第一天内未发生房颤事件;(4)未接受心脏手术,包括瓣膜手术和冠状动脉旁路移植术;(5)无房颤病史;(6)对于有多次ICU住院记录的患者,仅纳入其首次住院记录。图1展示了患者的筛选过程。
数据提取与结果
使用PostgreSQL中的结构化查询语言(SQL)从两个数据库中提取患者在ICU入院后24小时内的数据。本研究提取的变量包括:(1)人口学信息:年龄、性别、种族和体重;(2)合并症:心肌梗死(MI)、射血分数降低的心力衰竭(HFrEF)、射血分数保留的心力衰竭(HFpEF)、外周动脉疾病、脑血管疾病、慢性肺部疾病、慢性肾脏疾病、慢性肝脏疾病、高血压、糖尿病、败血症;(3)实验室指标:血红蛋白、白细胞(WBC)、血小板、血尿素氮(BUN)、肌酐、葡萄糖、阴离子间隙、钾、钠、钙、肌酸磷酸激酶(CK-CPK)、肌酸激酶同工酶(CK-MB)、N末端脑钠肽前体(NT-proBNP)、尿量;(4)生命体征:心率(HR)、呼吸频率(RR)、收缩压(SBP)、舒张压(DBP)、体温、经皮动脉血氧饱和度(SpO2);(5)干预措施:机械通气、连续肾脏替代治疗(CRRT)、血管活性药物、抗生素。对于多次测量的变量,除SpO2外,均取第一天的最大值和最小值。为减少缺失数据对模型构建的影响,使用KNNImputer(KNN)方法对缺失率低于20%的数据进行填补,并剔除缺失率超过20%的数据(图S1)。主要结果为ICU入院后第一天后发生的新发房颤,通过护士在床边记录的心率状态来定义。
统计分析与模型开发
本研究采用Kolmogorov–Smirnov检验分析连续变量,因变量非正态分布,故以中位数(四分位间距)描述并用Mann–Whitney U检验比较组间差异;分类变量以百分比表示,用Pearson卡方检验比较。针对因变量类别不平衡问题,采用欠采样方法平衡数据,并通过五折交叉验证将样本分为训练集和内部验证集。利用LASSO回归进行特征选择,引入L1正则化筛选重要特征并降维。研究使用8种机器学习算法(XGBoost、SVM、Adaboost、MLP、NN、NB、LR、GBM)构建预测模型,通过十折交叉验证和网格搜索调整参数,以ROC曲线下面积(AUC)最高为标准选择最优模型。模型在训练集上构建,并在内部和外部验证集上验证,通过AUC、敏感性、特异性、召回率、F1分数、准确性和召回率评估性能。同时,绘制决策曲线分析(DCA)和校准曲线以评估临床效用,并通过临床影响曲线(CIC)确定最佳阈值概率。使用SHAP方法可视化特征贡献,帮助理解模型决策过程,并通过特征递归消除法构建简化模型。所有分析在R软件(4.3.3)中完成,双侧P值小于0.05视为显著。
5.第五段-Results
结果
基线特征
研究共纳入16,528名MIMIC-IV患者,其中1,520名(9.2%)在ICU入院后发生新发房颤(NOAF)。另有6,037名患者来自MIMIC-III子集,其中677名(11.2%)发生NOAF。NOAF患者多为老年、白人,住院时间长,院内死亡率高(28.42% vs. 11.63%)。此外,NOAF患者在ICU入院第一天更常需要机械通气、CRRT等干预,实验室检查显示其血红蛋白、血小板、血压等指标较低,而白细胞、血尿素氮、肌酐等指标较高。

特征选择
通过LASSO回归筛选出23个与NOAF密切相关的变量,包括年龄、种族、体重、尿量、白细胞、血尿素氮、钾、心率、收缩压、舒张压、呼吸频率、体温、经皮动脉血氧饱和度等。

模型性能比较
研究使用8种机器学习算法构建预测模型,XGBoost模型表现最佳,验证集AUC为0.891(95%置信区间:0.878–0.903),外部验证集AUC为0.769(95%置信区间:0.755–0.782)。XGBoost模型的敏感性为0.826,特异性为0.775,F1分数为0.805,准确率为0.801。校准曲线显示,除朴素贝叶斯和Adaboost模型外,其他模型的预测概率与实际结果一致性较好。决策曲线分析(DCA)和临床影响曲线(CIC)表明,XGBoost模型在临床应用中具有较高的净收益,最终确定风险概率大于0.6为高风险阈值。

外部验证
尽管两个数据集的基线特征存在差异,但模型在外部验证中表现出良好的泛化能力,AUC为0.769(95%置信区间:0.755–0.782)。
可解释性分析
通过SHAP方法可视化模型,揭示了对预测结果贡献最大的8个特征:年龄、机械通气、尿量、败血症、血尿素氮、经皮动脉血氧饱和度、CRRT和体重。SHAP力图进一步展示了模型对特定患者的预测过程,帮助理解模型的决策机制。

模型应用
通过特征递归消除法优化模型,最终筛选出7个关键变量(年龄、体重、机械通气、CRRT、血管活性药物、射血分数降低的心力衰竭),并部署在专用网站上,方便临床医生快速评估患者NOAF风险。
6.第六段–结论与启发
结论与启发
结论
我们开发了一个用于预测危重病患者新发房颤(NOAF)风险的机器学习模型,并验证了其作为临床可靠工具的潜力。SHAP(SHapley Additive exPlanations)方法提高了模型的可解释性,使临床医生能够更好地理解新发房颤的原因,帮助提前预防并改善患者预后。
【光速科研启发】
选题:研究聚焦于危重病患者新发房颤(NOAF)的预测,填补了针对非心脏手术后危重病患者NOAF风险评估的研究空白,具有重要的临床意义和潜在的公共卫生价值。
统计学:采用LASSO回归进行特征选择,结合多种机器学习算法(如XGBoost、SVM等)构建预测模型,并通过ROC曲线下面积(AUC)、校准曲线、决策曲线分析(DCA)和临床影响曲线(CIC)等方法评估模型性能,同时利用SHAP方法对模型进行可解释性分析,揭示关键特征对预测结果的贡献。
数据库:利用MIMIC-IV和MIMIC-III数据库,确保样本量大且数据丰富,通过严格的纳入和排除标准提高样本质量,并采用欠采样方法解决类别不平衡问题,为模型构建和验证提供了坚实基础。
启发:研究提示在临床实践中,应重视对危重病患者NOAF风险的早期识别和干预;通过机器学习模型的开发和验证,发现年龄、机械通气、尿量等特征对NOAF的预测具有重要作用,为临床决策提供依据;利用机器学习技术处理复杂临床数据的成功经验,为其他疾病的预测模型开发提供了参考。