SEER被禁后，难免引起大家对NHANES、MIMIC数据库使用前景的担忧，然而小编想告诉大家的是，问题不大！我们国内的各种数据库已经筹备、应用很多年了，而且一定对加速完善！例如CHARLS数据库，单从发文量角度来说，24年开始已经有爆发的趋势，尤其今年才4月份，总发文量（OA）已经超过去年全年总量的一半！下半年只多不少，还在观望的朋友们可以考虑行动起来了。小编今天也给大家带来最新的CHARLS文献解读，由中山大学团队出品！

⭕️研究背景

心血管疾病（CVD）是全球死亡首因，而胰岛素抵抗（IR）是重要风险因素。传统IR评估指标（如HOMA-IR）依赖复杂检测，临床推广困难。eGDR（基于腰围、HbA1c和高血压计算）作为便捷指标，过去研究多关注单次测量，但动态变化对CVD的预测价值长期被忽视。本研究利用中国CHARLS队列，首次探讨eGDR的动态变化和累积效应对新发CVD的预测价值。

⭕️统计过程亮点（详见图2、3）

⭕️关键结果

风险分层：持续低eGDR组CVD风险最高（HR=2.51），骤降组次之（HR=1.95）。

累积效应：累积eGDR最低组CVD风险是最高组的3倍（HR=3.02）。

预测能力：累积eGDR的AUC（0.629）显著优于单次eGDR和TyG（p<0.05）。

临床价值：在基础模型中加入累积eGDR，预测效能提升最明显（IDI=0.009）。

⭕️结论

动态监测eGDR变化能更精准识别CVD高危人群，累积eGDR的预测价值远超单次测量。这对社区筛查和临床干预策略制定意义重大！

⭕️可圈可点

创新点：从“单次测量”转向“动态变化”，填补研究空白。（以往的研究主要关注单个时间点的胰岛素抵抗指标（如eGDR或TyG），而忽略了其随时间的动态变化。）

统计设计：联合聚类分析与累积指标，捕捉长期效应，提升模型解释力。

临床转化：强调“动态监测”在慢病管理中的实际应用价值。

⭕️思路启示

纵向数据分析（CHARLS数据库特点）：时间维度信息能揭示风险演变，避免单点偏差。

人群分层技巧：K-means聚类简化复杂变化，适合临床场景落地。

指标优化：累积指标（如累积eGDR）比单次值更稳定，尤其适合代谢性疾病研究。

数据收集

1. 数据来源：

使用中国健康与退休纵向研究（CHARLS）的数据。
CHARLS 是一项针对中国45岁及以上成年人的纵向研究，采用多阶段概率抽样技术。
数据包括社会人口学因素、生活方式和健康信息，通过每两年一次的面对面计算机辅助个人访谈（CAPI）收集。
体格检查数据在第1波（2012年）至第3波（2015年）期间测量，血液样本在第1波和第3波收集并检测。

2. 样本选择：

纳入标准：第1波有血液检测结果的个体。
排除标准：
缺少第1波或第3波的HbA1c或腰围（WC）数据。
缺少空腹血糖（FBG）或甘油三酯（TG）数据。
在第3波之前已有新发心血管疾病（CVD）或缺少新发CVD或后续随访信息。
年龄小于45岁或缺少其他变量。

变量定义与计算

1. eGDR（估计葡萄糖处置率）计算：

使用公式：
eGDR = 21.158 – 0.09 × WC – 3.407 × 高血压 – 0.551 × HbA1c 其中，高血压定义为：收缩压≥140 mmHg，或舒张压≥90 mmHg，或基于医生诊断的自报高血压，或使用任何降压治疗。

2. 累积eGDR计算：

使用公式：
累积eGDR = (eGDR₍2012₎ + eGDR₍2015₎)/2 × (时间₍2015₎ – 时间₍2012₎)

3. 结果变量定义：

主要结局：新发心血管疾病（包括心脏病和中风）。
次要结局：新发心脏病或中风。
通过标准化问题确认，如“您是否曾被医生诊断为心脏病或中风？”“您是否正在接受任何治疗？”等。

协变量选择：

包括社会人口学因素（年龄、性别、婚姻状况、户籍状况、教育水平）、生活方式因素（吸烟和饮酒状况）、体格测量（身高和体重）、健康状况（高血压、糖尿病和癌症）、药物使用史（糖尿病治疗和降脂治疗）以及实验室检查（FBG、TG、低密度脂蛋白胆固醇、总胆固醇和估算肾小球滤过率）。

统计分析

1. K-means聚类分析：

用于对2012年至2015年间eGDR变化进行分类。
使用肘部法则确定最佳类数量，将参与者分为三类：
类别①：持续高水平eGDR。
类别②：eGDR从高水平显著下降至低水平。
类别③：持续低水平eGDR。

2. 累积eGDR分组：

根据四分位数将累积eGDR分为四组，以评估其与结局的关联。

3. 描述性分析：

连续变量以均值（标准差）表示，分类变量以频率（百分比）表示。
使用方差分析或卡方检验进行描述性分析。

4. Cox回归模型：

用于评估eGDR变化与新发CVD之间的关系。
结果以风险比（HR）和95%置信区间（CI）报告。

5. 限制性立方样条（RCS）分析：

基于变量eGDR回归模型，用于评估累积eGDR与新发CVD之间的潜在非线性关系。

6. ROC曲线分析：

用于评估TyG、eGDR和累积eGDR对新发CVD的预测价值。
计算曲线下面积（AUC）以比较预测效率。

7. 重新分类改善指数（NRI）和综合判别改进（IDI）：

用于评估累积eGDR在传统心血管风险因素基础上的额外预测价值。

8. 亚组分析：

按年龄（<60岁/≥60岁）、性别（男性/女性）、婚姻状况（已婚/其他）、户籍状况（农业/其他）和教育水平（<中学/中学及以上）进行分层分析。

CHARLS今年将爆发！最新二区工作量解读！