
CHARLS今年将爆发!最新二区工作量解读!
SEER被禁后,难免引起大家对NHANES、MIMIC数据库使用前景的担忧,然而小编想告诉大家的是,问题不大!我们国内的各种数据库已经筹备、应用很多年了,而且一定对加速完善!例如CHARLS数据库,单从发文量角度来说,24年开始已经有爆发的趋势,尤其今年才4月份,总发文量(OA)已经超过去年全年总量的一半!下半年只多不少,还在观望的朋友们可以考虑行动起来了。小编今天也给大家带来最新的CHARLS文献解读,由中山大学团队出品!
⭕️研究背景
心血管疾病(CVD)是全球死亡首因,而胰岛素抵抗(IR)是重要风险因素。传统IR评估指标(如HOMA-IR)依赖复杂检测,临床推广困难。eGDR(基于腰围、HbA1c和高血压计算)作为便捷指标,过去研究多关注单次测量,但动态变化对CVD的预测价值长期被忽视。本研究利用中国CHARLS队列,首次探讨eGDR的动态变化和累积效应对新发CVD的预测价值。
⭕️统计过程亮点(详见图2、3)
⭕️关键结果
风险分层:持续低eGDR组CVD风险最高(HR=2.51),骤降组次之(HR=1.95)。
累积效应:累积eGDR最低组CVD风险是最高组的3倍(HR=3.02)。
预测能力:累积eGDR的AUC(0.629)显著优于单次eGDR和TyG(p<0.05)。
临床价值:在基础模型中加入累积eGDR,预测效能提升最明显(IDI=0.009)。
⭕️结论
动态监测eGDR变化能更精准识别CVD高危人群,累积eGDR的预测价值远超单次测量。这对社区筛查和临床干预策略制定意义重大!
⭕️可圈可点
创新点:从“单次测量”转向“动态变化”,填补研究空白。(以往的研究主要关注单个时间点的胰岛素抵抗指标(如eGDR或TyG),而忽略了其随时间的动态变化。)
统计设计:联合聚类分析与累积指标,捕捉长期效应,提升模型解释力。
临床转化:强调“动态监测”在慢病管理中的实际应用价值。
⭕️思路启示
纵向数据分析(CHARLS数据库特点):时间维度信息能揭示风险演变,避免单点偏差。
人群分层技巧:K-means聚类简化复杂变化,适合临床场景落地。
指标优化:累积指标(如累积eGDR)比单次值更稳定,尤其适合代谢性疾病研究。
数据收集
1. 数据来源:
- 使用中国健康与退休纵向研究(CHARLS) 的数据。
- CHARLS 是一项针对中国45岁及以上成年人的纵向研究,采用多阶段概率抽样技术。
- 数据包括社会人口学因素、生活方式和健康信息,通过每两年一次的面对面计算机辅助个人访谈(CAPI)收集。
- 体格检查数据在第1波(2012年)至第3波(2015年)期间测量,血液样本在第1波和第3波收集并检测。
2. 样本选择:
- 纳入标准:第1波有血液检测结果的个体。
- 排除标准:
- 缺少第1波或第3波的HbA1c或腰围(WC)数据。
- 缺少空腹血糖(FBG)或甘油三酯(TG)数据。
- 在第3波之前已有新发心血管疾病(CVD)或缺少新发CVD或后续随访信息。
- 年龄小于45岁或缺少其他变量。
变量定义与计算
1. eGDR(估计葡萄糖处置率)计算:
- 使用公式:
eGDR = 21.158 – 0.09 × WC – 3.407 × 高血压 – 0.551 × HbA1c 其中,高血压定义为:收缩压≥140 mmHg,或舒张压≥90 mmHg,或基于医生诊断的自报高血压,或使用任何降压治疗。
2. 累积eGDR计算:
- 使用公式:
累积eGDR = (eGDR₍2012₎ + eGDR₍2015₎)/2 × (时间₍2015₎ – 时间₍2012₎)
3. 结果变量定义:
- 主要结局:新发心血管疾病(包括心脏病和中风)。
- 次要结局:新发心脏病或中风。
- 通过标准化问题确认,如“您是否曾被医生诊断为心脏病或中风?”“您是否正在接受任何治疗?”等。
协变量选择:
包括社会人口学因素(年龄、性别、婚姻状况、户籍状况、教育水平)、生活方式因素(吸烟和饮酒状况)、体格测量(身高和体重)、健康状况(高血压、糖尿病和癌症)、药物使用史(糖尿病治疗和降脂治疗)以及实验室检查(FBG、TG、低密度脂蛋白胆固醇、总胆固醇和估算肾小球滤过率)。
统计分析
1. K-means聚类分析:
- 用于对2012年至2015年间eGDR变化进行分类。
- 使用肘部法则确定最佳类数量,将参与者分为三类:
- 类别①:持续高水平eGDR。
- 类别②:eGDR从高水平显著下降至低水平。
- 类别③:持续低水平eGDR。
2. 累积eGDR分组:
- 根据四分位数将累积eGDR分为四组,以评估其与结局的关联。
3. 描述性分析:
- 连续变量以均值(标准差)表示,分类变量以频率(百分比)表示。
- 使用方差分析或卡方检验进行描述性分析。
4. Cox回归模型:
- 用于评估eGDR变化与新发CVD之间的关系。
- 结果以风险比(HR)和95%置信区间(CI)报告。
5. 限制性立方样条(RCS)分析:
- 基于变量eGDR回归模型,用于评估累积eGDR与新发CVD之间的潜在非线性关系。
6. ROC曲线分析:
- 用于评估TyG、eGDR和累积eGDR对新发CVD的预测价值。
- 计算曲线下面积(AUC)以比较预测效率。
7. 重新分类改善指数(NRI)和综合判别改进(IDI):
- 用于评估累积eGDR在传统心血管风险因素基础上的额外预测价值。
8. 亚组分析:
- 按年龄(<60岁/≥60岁)、性别(男性/女性)、婚姻状况(已婚/其他)、户籍状况(农业/其他)和教育水平(<中学/中学及以上)进行分层分析。