机器学习+SHAP=NHANES发1区新风口🧐

广州中医药大学近期发表在10.7分1区牛刊《Redox Biology》的一篇文章很有意思,大家一起看看。

📑《Machine learning and SHAP value interpretation for predicting comorbidity of cardiovascular disease and cancer with dietary antioxidants》

(基于机器学习与SHAP值解析膳食抗氧化剂对心血管病与癌症共病的预测)

⭕️研究背景:心血管疾病(CVD)与癌症常“相伴而生”,两者共享氧化应激、炎症等病理机制。而膳食中的抗氧化剂(如维生素、多酚)能中和自由基,可能降低共病风险。但传统统计方法难以处理复杂数据关系,机器学习(ML) 结合 SHAP值解释 成为新突破!

⭕️研究过程(详见图2)

数据来源:美国NHANES调查(2007-2018),纳入10,064名参与者,其中353人确诊CVD与癌症共病。

预处理:去除共线性特征、标准化数据、解决类别不平衡问题。

特征选择:44种膳食抗氧化剂(如维生素C、镁) + 人口、生活方式等基线特征。

模型构建:对比5种ML模型(RPART、RF、K-KNN、NB、LightGBM),通过SHAP值解析关键因素。

⭕️关键结果

✅ 最佳模型:LightGBM表现最优,准确率87.9%,AUC高达0.951!

✅ 核心抗氧化剂:SHAP值显示,柚皮素(naringenin)、镁(Mg)、茶黄素(theaflavin)、**硒(Se)**等对降低共病风险贡献最大。

✅ 机制关联:这些成分通过抗氧化、抗炎、调节细胞通路(如血管平滑肌增殖)发挥作用

研究结论

LightGBM模型能高效预测CVD与癌症共病,为临床风险评估提供新工具。

膳食抗氧化剂是关键可干预因素,尤其柚皮素(柑橘类水果富含)和镁(坚果、绿叶菜来源)值得关注!

⭕️小光观点分享 💡

ML的医学潜力:不仅能处理高维数据,还能揭示传统方法忽略的隐含关联(如特定抗氧化剂的协同作用)。

结合ML与可解释性工具(如SHAP),探索更多疾病预测的“隐藏因子”。

Leave a Reply

Your email address will not be published. Required fields are marked *