
机器学习+SHAP=NHANES发1区新风口🧐
广州中医药大学近期发表在10.7分1区牛刊《Redox Biology》的一篇文章很有意思,大家一起看看。
📑《Machine learning and SHAP value interpretation for predicting comorbidity of cardiovascular disease and cancer with dietary antioxidants》
(基于机器学习与SHAP值解析膳食抗氧化剂对心血管病与癌症共病的预测)
⭕️研究背景:心血管疾病(CVD)与癌症常“相伴而生”,两者共享氧化应激、炎症等病理机制。而膳食中的抗氧化剂(如维生素、多酚)能中和自由基,可能降低共病风险。但传统统计方法难以处理复杂数据关系,机器学习(ML) 结合 SHAP值解释 成为新突破!
⭕️研究过程(详见图2)
数据来源:美国NHANES调查(2007-2018),纳入10,064名参与者,其中353人确诊CVD与癌症共病。
预处理:去除共线性特征、标准化数据、解决类别不平衡问题。
特征选择:44种膳食抗氧化剂(如维生素C、镁) + 人口、生活方式等基线特征。
模型构建:对比5种ML模型(RPART、RF、K-KNN、NB、LightGBM),通过SHAP值解析关键因素。
⭕️关键结果
✅ 最佳模型:LightGBM表现最优,准确率87.9%,AUC高达0.951!
✅ 核心抗氧化剂:SHAP值显示,柚皮素(naringenin)、镁(Mg)、茶黄素(theaflavin)、**硒(Se)**等对降低共病风险贡献最大。
✅ 机制关联:这些成分通过抗氧化、抗炎、调节细胞通路(如血管平滑肌增殖)发挥作用
研究结论
LightGBM模型能高效预测CVD与癌症共病,为临床风险评估提供新工具。
膳食抗氧化剂是关键可干预因素,尤其柚皮素(柑橘类水果富含)和镁(坚果、绿叶菜来源)值得关注!
⭕️小光观点分享 💡
ML的医学潜力:不仅能处理高维数据,还能揭示传统方法忽略的隐含关联(如特定抗氧化剂的协同作用)。
结合ML与可解释性工具(如SHAP),探索更多疾病预测的“隐藏因子”。