CHARLS今年将爆发!最新二区工作量解读!

SEER被禁后,难免引起大家对NHANES、MIMIC数据库使用前景的担忧,然而小编想告诉大家的是,问题不大!我们国内的各种数据库已经筹备、应用很多年了,而且一定对加速完善!例如CHARLS数据库,单从发文量角度来说,24年开始已经有爆发的趋势,尤其今年才4月份,总发文量(OA)已经超过去年全年总量的一半!下半年只多不少,还在观望的朋友们可以考虑行动起来了。小编今天也给大家带来最新的CHARLS文献解读,由中山大学团队出品!

⭕️研究背景

心血管疾病(CVD)是全球死亡首因,而胰岛素抵抗(IR)是重要风险因素。传统IR评估指标(如HOMA-IR)依赖复杂检测,临床推广困难。eGDR(基于腰围、HbA1c和高血压计算)作为便捷指标,过去研究多关注单次测量,但动态变化对CVD的预测价值长期被忽视。本研究利用中国CHARLS队列,首次探讨eGDR的动态变化和累积效应对新发CVD的预测价值。

⭕️统计过程亮点(详见图2、3)

⭕️关键结果

风险分层:持续低eGDR组CVD风险最高(HR=2.51),骤降组次之(HR=1.95)。

累积效应:累积eGDR最低组CVD风险是最高组的3倍(HR=3.02)。

预测能力:累积eGDR的AUC(0.629)显著优于单次eGDR和TyG(p<0.05)。

临床价值:在基础模型中加入累积eGDR,预测效能提升最明显(IDI=0.009)。

⭕️结论

动态监测eGDR变化能更精准识别CVD高危人群,累积eGDR的预测价值远超单次测量。这对社区筛查和临床干预策略制定意义重大!

⭕️可圈可点

创新点:从“单次测量”转向“动态变化”,填补研究空白。(以往的研究主要关注单个时间点的胰岛素抵抗指标(如eGDR或TyG),而忽略了其随时间的动态变化。)

统计设计:联合聚类分析与累积指标,捕捉长期效应,提升模型解释力。

临床转化:强调“动态监测”在慢病管理中的实际应用价值。

⭕️思路启示

纵向数据分析(CHARLS数据库特点):时间维度信息能揭示风险演变,避免单点偏差。

人群分层技巧:K-means聚类简化复杂变化,适合临床场景落地。

指标优化:累积指标(如累积eGDR)比单次值更稳定,尤其适合代谢性疾病研究。

数据收集

1. 数据来源:

  • 使用中国健康与退休纵向研究(CHARLS) 的数据。
  • CHARLS 是一项针对中国45岁及以上成年人的纵向研究,采用多阶段概率抽样技术。
  • 数据包括社会人口学因素、生活方式和健康信息,通过每两年一次的面对面计算机辅助个人访谈(CAPI)收集。
  • 体格检查数据在第1波(2012年)至第3波(2015年)期间测量,血液样本在第1波和第3波收集并检测。

2. 样本选择:

  • 纳入标准:第1波有血液检测结果的个体。
  • 排除标准
  • 缺少第1波或第3波的HbA1c或腰围(WC)数据。
  • 缺少空腹血糖(FBG)或甘油三酯(TG)数据。
  • 在第3波之前已有新发心血管疾病(CVD)或缺少新发CVD或后续随访信息。
  • 年龄小于45岁或缺少其他变量。

变量定义与计算

1. eGDR(估计葡萄糖处置率)计算:

  • 使用公式:
    eGDR = 21.158 – 0.09 × WC – 3.407 × 高血压 – 0.551 × HbA1c 其中,高血压定义为:收缩压≥140 mmHg,或舒张压≥90 mmHg,或基于医生诊断的自报高血压,或使用任何降压治疗。

2. 累积eGDR计算:

  • 使用公式:
    累积eGDR = (eGDR₍2012₎ + eGDR₍2015₎)/2 × (时间₍2015₎ – 时间₍2012₎)

3. 结果变量定义:

  • 主要结局:新发心血管疾病(包括心脏病和中风)。
  • 次要结局:新发心脏病或中风。
  • 通过标准化问题确认,如“您是否曾被医生诊断为心脏病或中风?”“您是否正在接受任何治疗?”等。

协变量选择:

包括社会人口学因素(年龄、性别、婚姻状况、户籍状况、教育水平)、生活方式因素(吸烟和饮酒状况)、体格测量(身高和体重)、健康状况(高血压、糖尿病和癌症)、药物使用史(糖尿病治疗和降脂治疗)以及实验室检查(FBG、TG、低密度脂蛋白胆固醇、总胆固醇和估算肾小球滤过率)。


统计分析

1. K-means聚类分析:

  • 用于对2012年至2015年间eGDR变化进行分类。
  • 使用肘部法则确定最佳类数量,将参与者分为三类:
  • 类别①:持续高水平eGDR。
  • 类别②:eGDR从高水平显著下降至低水平。
  • 类别③:持续低水平eGDR。

2. 累积eGDR分组:

  • 根据四分位数将累积eGDR分为四组,以评估其与结局的关联。

3. 描述性分析:

  • 连续变量以均值(标准差)表示,分类变量以频率(百分比)表示。
  • 使用方差分析或卡方检验进行描述性分析。

4. Cox回归模型:

  • 用于评估eGDR变化与新发CVD之间的关系。
  • 结果以风险比(HR)和95%置信区间(CI)报告。

5. 限制性立方样条(RCS)分析:

  • 基于变量eGDR回归模型,用于评估累积eGDR与新发CVD之间的潜在非线性关系。

6. ROC曲线分析:

  • 用于评估TyG、eGDR和累积eGDR对新发CVD的预测价值。
  • 计算曲线下面积(AUC)以比较预测效率。

7. 重新分类改善指数(NRI)和综合判别改进(IDI):

  • 用于评估累积eGDR在传统心血管风险因素基础上的额外预测价值。

8. 亚组分析:

  • 按年龄(<60岁/≥60岁)、性别(男性/女性)、婚姻状况(已婚/其他)、户籍状况(农业/其他)和教育水平(<中学/中学及以上)进行分层分析。

Leave a Reply

Your email address will not be published. Required fields are marked *