如何水文章:Nhanes+Machine Learning~
文章题目:Predicting youth diabetes risk using NHANES data and machine learning
DOI:10.1038/s41598-021-90406-0
中文标题:利用 NHANES 数据和机器学习预测青少年糖尿病风险
发表杂志:Scientific reports
影响因子:2区,IF=4.6
发表时间:2021年4月
今天给大家分享一篇在2021年4月发表在《Scientific Reports》(2区,IF=4.6)的文章。本文这项研究利用了美国国家健康和营养调查(NHANES)的大规模数据集,结合机器学习方法,来预测青少年糖尿病风险。
预测因子:研究考虑了以下预测因子:BMI百分位、糖尿病家族史、种族/民族(非西班牙裔白人与其他)、高血压(是/否)以及总胆固醇水平。
结局:研究的结局是基于生物标志物(空腹血糖[FPG]、口服糖耐量测试后2小时血糖[2hrPG]和糖化血红蛋白[HbA1c])测量的青少年糖尿病前期(prediabetes, preDM)和糖尿病(diabetes mellitus, DM)状态。
Table1 用于定义青少年糖尿病前期/糖尿病(preDM/DM)状态的儿科临床筛查指南,以及在国家健康和营养检查调查(NHANES)中相应的操作定义等效变量。
Table2 研究人群的特征(n=2858)
Table 3. 可能包含了儿科临床筛查指南与基于生物标志物的糖尿病前期(prediabetes, preDM)和糖尿病(diabetes mellitus, DM)诊断标准相比较时的性能评估指标。
Figure 1. 展示了美国糖尿病协会(American Diabetes Association, ADA)儿科筛查指南在不同年龄组、种族/民族和性别中识别具有糖尿病前期/糖尿病(PreDM/DM)的青少年的性能变化。
Figure 2. 展示了使用机器学习算法将个体分类为糖尿病前期/糖尿病(preDM/DM)和非糖尿病的非preDM/DM类别的性能,评估指标可能包括预测值、敏感度/特异度和两个类别的F-measures。
结果解读:研究发现,根据生物标志物标准,研究人群中约29%的青少年有preDM/DM。临床筛查指南的敏感性为43.1%,特异性为67.6%,阳性/阴性预测值分别为35.2%/74.5%,阳性/阴性F-measure分别为38.8%/70.9%,Kappa值为0.1(95%CI: 0.06–0.14)。指南在不同人口亚组中的性能表现不一。一些基于机器学习的分类器的表现与筛查指南相当或更好,尤其是在识别preDM/DM青少年方面(p = 5.23 × 10−5)。
结论:文章的结论指出,目前推荐的儿科临床筛查指南在识别青少年preDM/DM状态方面表现不佳。需要进一步的工作来开发一个简单但准确的青少年糖尿病风险筛查工具,可能通过使用先进的机器学习方法和更广泛的临床及行为健康数据。
课题思路这不就来了么?万层高楼平底起,一起加油呀!