审稿人:因果图模型,NHANES科研人探究因果关联的最新稻草!(附方法解读)

高血压是全球公共卫生的重大问题,与心血管疾病(CVD)的高发病率和死亡率密切相关。尽管已有大量研究探讨了高血压患者心血管预后的生物标志物,但多数研究仅关注单一暴露与结局的关联,忽略了多因素间的复杂交互作用及其潜在通路。

2025年6月19日,大连大学附属中山医院学者用NHANES数据库,在期刊Journal of Translational Medicine(医学二区Top,IF=7.5)发表了一篇题为:“Identifying pathways to cardiovascular mortality by causal graphical models and mediation analysis among hypertensive patients: insights from a prospective study”的研究论文。

研究旨在通过先进的方法(如因果图模型)来揭示生物标志物(如代谢、炎症、肝功能、肾功能等)与CVD死亡率之间的直接和间接因果关系。

研究团队基于美国国家健康与营养调查(NHANES)1999-2018年数据,经过纳排,最终纳入了3559名年龄≥20岁的高血压患者,平均年龄为58.22岁。其中,562例在中位随访154个月后,死于CVD。

研究应用混合图形模型-快速因果推理-最大算法(MGM-FCI-MAX)建立因果图形模型(CGM),描述和识别高血压患者CVD死亡(主要结局)的直接和间接原因。随后,基于因果路径进行中介分析,量化中介变量的间接效应。

由于性别和种族是CVD预后的两个重要的不可改变的因素,因此研究根据性别和种族进行生存分析,结果显示,女性和非白人种族(西班牙裔、黑人、其他)的CVD生存率显著高于男性和非西班牙裔白人。

基于CGM,研究确定了导致CVD死亡的三个直接原因:估计肾小球滤过率(eGFR),血尿素氮(BUN)和单核细胞,分别代表了肾功能(肾小球滤过功能)、肾功能(氮代谢废物清除)和免疫炎症功能(单核细胞介导的炎症)。

通过中介分析也确定了其他间接因果因素的介导效应,结果显示,

  • BUN显著介导了 eGFR 对 CVD死亡的影响(中介比例为 30.29%);
  • 单核细胞显著介导了性别对CVD死亡的影响(中介比例为 21.73%);
  • eGFR显著介导了种族对CVD死亡的影响(中介比例为 20.96% )。

然而,未发现肝酶标志物或胰岛素通路通过eGFR中介的显著效应。

综上所述,通过因果图模型,研究揭示了高血压患者心血管死亡率的多条因果路径,强调了肾功能和炎症标志物的直接作用,以及性别和种族通过特定生物标志物的间接影响。

这些发现为临床干预提供了新靶点,并展示了因果图模型在复杂疾病机制研究中的价值。

因果图形模型(CGM)

因果图形模型是一种基于概率图模型的统计方法,用于表示变量之间的因果关系。其核心思想是通过有向无环图(DAG)部分有向无环图(PAG)来刻画变量间的因果依赖关系,其中:

  • 节点(Node)代表变量(如生物标志物、临床特征等);
  • 边(Edge)表示变量间的因果关系(如“A → B”表示A直接影响B);
  • 条件独立性用于推断因果关系,避免混杂因素的影响。

➡️通俗比喻

因果图就像一张“城市交通地图”: 节点是路口,有向边是单行道(表示因果方向)。你想知道从A路口(原因)开车到B路口(结果)需要多久(因果效应)。

混杂因子就像“隐藏的小路”: 有一条未在地图标出的、连接A和B的小路(混杂因子)。如果你只看A和B之间的主路(直接因果),可能会忽略这条小路带来的额外车流(虚假关联)。

CGM的作用:

  • 画地图: 让你尽可能把所有可能的小路(混杂因子)都标出来(基于知识假设);
  • 找小路: 分析地图结构,找出所有能从A通到B的非主路路径(后门路径);
  • 设路障: 告诉你在哪些小路上设置路障(控制/调整变量)可以阻断这些非主路的车流,这样你测量A到B主路的通行时间(因果效应)才准确;
  • 模拟修路: 告诉你如果强行改变某个路口的规则(do干预),整个交通流(结果分布)会变成什么样。

本研究采用 MGM-FCI-MAX(混合图模型-快速因果推理-最大算法)构建因果图模型,具体应用如下:

变量分层:将变量分为三层

  • 第一层:人口统计学特征(如年龄、性别、种族);
  • 第二层:血清生物标志物(如eGFR、BUN、单核细胞);
  • 第三层:结局变量(心血管死亡率)。

边方向限制:仅允许第一层变量直接影响第二层,第二层直接影响第三层,避免反向因果。

边类型解释:

①A → B:A是B的原因(如eGFR → BUN);

②A <-> B:存在未观测混杂同时影响A和B;

③A o→ B:B不可能是A的原因(A→B或存在混杂);

④A o-o B:方向不确定。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注