新!强大阵容学术团队怎么做11+分双样本MR!探究20种氨基酸的母体血清水平对后代出生体重的因果效应
今天分享一篇2023年发表的顶刊孟德尔文章,通过作者机构就足以看出阵容十分豪华。本研究的目的是使用双样本MR来评估20种已确定氨基酸的母体血清水平对多达406,063名具有母体和/或胎儿基因型效应估计值的个体的后代出生体重的潜在因果效应。
看完过后,课题思路这不就来了么?实操数据量很大,不过万层高楼平地起,思路正确就能搞出好的结果。
研究暴露:氨基酸遗传关联的汇总数据来自最近进行的174种血浆代谢物的跨平台GWAS,其中包括20种循环氨基酸的水平。
研究结局:从出生体重GWAS中提取,使用了母体遗传变异对后代出生体重的关联的汇总数据。
文章题目:Causal effects of maternal circulating amino acids on offspring birthweight: a Mendelian randomisation study
DOI:10.1016/j.ebiom.2023.104441
中文标题:使用双样本MR来评估20种已确定氨基酸的母体血清水平对个体的后代出生体重的潜在因果效应
发表杂志:EBioMedicine
影响因子:11.1
发表时间:2023年2月
论文亮点
本研究通过Mendelian随机化方法,探讨了母亲血液中氨基酸对胎儿出生体重的影响。研究利用两个独立的样本集——一个包含86,507人的血清氨基酸水平的全基因组关联研究(GWAS),以及一个包含406,063人的英国生物库和早期生长遗传学联盟的胎儿出生体重的母体GWAS——来评估19种氨基酸对胎儿生长的潜在因果效应。研究发现,母亲血液中的谷氨酰胺和丝氨酸水平与胎儿出生体重增加有关,而亮氨酸和苯丙氨酸水平则与出生体重降低有关。这些发现通过一系列敏感性分析得到了支持。研究结果为母亲血液中氨基酸在健康胎儿生长中的关键作用提供了证据,并为未来优化胎儿生长的潜在干预措施(例如,孕期氨基酸补充)奠定了基础。
摘要
背景:氨基酸是蛋白质合成、能量代谢、细胞信号传导和基因表达的关键;然而,特定的母体氨基酸对胎儿生长的贡献尚不清楚。
方法:我们使用双样本孟德尔随机化 (MR) 和血清氨基酸水平全基因组关联研究 (GWAS) 的汇总数据(样本 1,n = 86,507)和英国生物样本库和早期生长遗传学联盟中后代出生体重的母体 GWAS,调整胎儿基因型效应(样本 2, n = 406,063,母体和/或胎儿基因型效应估计)。共有 106 个独立的单核苷酸多态性与 19 个氨基酸 (p < 4.9 × 10−10) 强相关,用作遗传工具变量 (IV)。MR主分析采用Wald比和逆方差加权法。进行了一系列敏感性分析,以探索 IV 假设的违反。
发现:我们的研究结果提供了证据表明,母体循环谷氨酰胺(母体氨基酸水平每增加一个标准差,后代出生体重增加 59 克,95% CI:7,110)和丝氨酸(27 g,95% CI:9,46)增加,而亮氨酸(-59 g,95% CI:-106,-11)和苯丙氨酸(-25 g,95% CI:-47,-4)降低后代出生体重。这些发现得到了敏感性分析的支持。
解释:我们的 研究结果加强了孕期母体循环氨基酸在胎儿健康生长中关键作用的证据。
关键词: 氨基酸;出生体重;GWAS的;孟德尔随机化;因果效应
背景研究
本研究前的证据
氨基酸对胎儿的健康生长至关重要,然而,由于之前进行的人体研究很少,而且小型研究的结论不一致,关于特定氨基酸对胎儿生长的贡献的最新证据仍然有限。既往观察性研究的不一致结果可能是由于混杂偏倚(例如,在先前研究中因肥胖相关特征而混淆)所导致的偏倚风险。因此,孕期母体循环氨基酸与后代出生体重之间的因果关系尚不清楚。
本研究的附加值
使用双样本孟德尔随机化分析,我们根据来自最大全基因组的汇总水平数据,检查了孕期母体循环氨基酸对后代出生体重的因果效应。在英国生物银行和早期生长遗传学联盟中,通过高通量平台(86,507 名个体)和后代出生体重的母体 GWAS(406,063 名具有母体和/或胎儿基因型效应估计的个体)测量的血清氨基酸水平的关联研究 (GWAS)。我们发现了几种具有潜在生物学意义的母体循环氨基酸,它们对后代出生体重有因果影响。
所有现有证据的意义
我们的研究结果表明,母体遗传预测的谷氨酰胺和丝氨酸水平会增加后代出生体重,而亮氨酸和苯丙氨酸似乎会降低后代出生体重。未来的随机对照试验是必要的,以确定潜在的干预机会(例如,在怀孕期间补充氨基酸),以优化胎儿的健康生长。
介绍
健康的胎儿生长发育对于生存、短期和潜在的长期健康至关重要。氨基酸对于蛋白质和许多其他分子的合成以及多种细胞信号通路的调节至关重要。据估计,氨基酸需要以每公斤胎儿 10 至 60 克/天的速度供应,才能充分促进胎儿生长。体内人体研究强调了母体、胎盘和胎儿机制在如何将不同氨基酸输送给胎儿方面的复杂相互作用。然而,关于母体氨基酸如何影响胎儿生长发育的人体研究证据很少,关于有胎儿生长风险的妊娠补充氨基酸的小型研究得出的结论不一致限制。
孟德尔随机化 (MR) 是一种方法,其中与可改变的暴露密切相关的遗传变异被用作工具变量,以推断暴露与感兴趣的结果之间的因果关系。母体遗传变异,通常是单核苷酸多态性 (SNP),越来越多地被用作工具变量,用于在 MR 分析中检查遗传影响的宫内暴露与后代出生体重之间的因果关系。这些都证实了母亲在怀孕期间吸烟对胎儿生长缓慢的因果关系,正如重复超声扫描和较低的出生体重,以及孕前体重指数和较高的空腹血糖和较高的出生体重。MR不太可能受到社会经济、环境、行为和健康因素的偏倚,这些因素混淆了传统的多变量分析,尽管它受到其他偏倚来源的影响,例如弱仪器偏倚和不平衡水平多效性的偏倚(下文讨论)。它还可以提供对人与人之间暴露差异的长期(可能贯穿整个生命过程)评估。与这项研究有关,它可以建立怀孕期间母体循环氨基酸对胎儿生长影响的证据(如出生体重所示)。
本研究的目的是使用双样本 MR 来估计母体血清中 20 种已建立氨基酸的水平对多达 406,063 名个体的后代出生体重的潜在因果效应,并估计母体和/或胎儿基因型效应。
方法
我们从最大的全基因组关联研究 (GWAS) 中选择了与 20 种不同的循环氨基酸密切相关的遗传变异(N 高达 86,507), 这些变异在出生在布拉德福德 (BiB) 研究的孕妇样本 (N = 2,966) 中得到验证——这是唯一一项我们可以识别的孕产妇妊娠循环氨基酸和全基因组数据的研究25—仅女性 (N = 4,407) 使用主要 GWAS 中包含的芬兰研究数据。我们使用这些遗传变异作为工具,在双样本汇总数据 MR 框架中检查怀孕期间母体循环氨基酸对后代出生体重的影响。
数据源
样本 1:遗传变异和氨基酸之间关联的估计值
遗传变异和氨基酸之间关联的汇总数据是从最近进行的 174 种代谢物的跨平台 GWAS 中检索的,其中包括 20 种氨基酸和多达 86,507 名成年女性和男性(对于单个代谢物,样本量从 8,569 到 86,507 不等)。24 在以下英国成年人队列中对多达 174 种血浆代谢物进行了全基因组关联分析。
EPIC-Norfolk (N = 5,841),其中使用 MS(代谢发现 HD4)测量代谢物。
使用MS(代谢发现HD4平台,N = 8,455)和质子核磁共振(1H NMR,Nightingale,N = 40,905)测量代谢物的INTERVAL研究。
鉴于在 Fenland 研究中使用了两种基因分型芯片(Affymetrix Axiom 和 Affymetrix SNP5.0),首先在 Fenland 研究中进行了基于这两种芯片的全基因组关联荟萃分析 ,然后将结果与 EPIC-Norfolk 和 INTERVAL 中的全基因组关联结果进行荟萃分析,以获取与 Fenland Biocrates 平台中测量的代谢物相匹配的代谢物。这些结果进一步荟萃分析了来自两项研究的公开GWAS摘要数据。
Kettunen 等人对 123 种代谢物的 GWAS 荟萃分析,使用 NMR 波谱对来自欧洲 14 个队列的多达 24,925 名个体进行了荟萃分析。27
Shin 等人使用 MS Metabolon 平台对多达 7,824 名个体的 MS Metabolon 平台对多达 7,824 名个体进行了 GWAS 荟萃分析。
对于每种代谢物,使用METAL根据上述汇总数据对z评分进行meta分析。在meta分析后进行质量控制,排除次要等位基因频率(MAF)低于0.5%且未被至少一半的参与研究或所测量的每种代谢物的样本量捕获的变异。
meta分析共纳入20种氨基酸(丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸)。我们根据上述基于z分数的meta分析结果中报告的z分数、样本量和MAF,使用参考文献中介绍的方法计算了SNP效应和标准误。
样本2:母体遗传变异与后代出生体重之间关联的估计值
遗传变异与出生体重之间关联的汇总数据是从最新的出生体重GWAS中提取的,其中包括297,356名报告自己出生体重的个体和210,248名报告其后代出生体重的女性被合并到分析中(总计n = 406,063)。30 名胎龄小于 37 周(如果已知)或出生体重小于 2.5 公斤或大于 4.5 公斤(在英国生物样本库)的参与者被排除在外。在该GWAS中,与出生体重的关联以标准差(SD)单位表示,我们将其乘以484(该GWAS中包含的18个前瞻性队列中出生体重的中位SD)以获得以克为单位的结果,这更容易解释。
在这项研究中,我们主要感兴趣的是使用母体遗传变异来测试母体循环氨基酸对后代出生体重的影响。利用MR测试宫内对后代结果(如出生体重)的因果影响的一个挑战是母体和后代基因型之间的相关性。如果后代遗传变异影响后代结果,则可能违反了排除限制假设。Warrington等人的GWAS使用新开发的结构方程建模(SEM)方法来划分母体和胎儿遗传对出生体重的影响。
在这项研究中,我们使用了母体遗传变异与后代出生体重相关的汇总数据,并针对后代遗传效应进行了调整,如加权线性模型调整(WLM 调整)分析提供的那样,这是 SEM 方法的近似值。
遗传工具变量选择和与出生体重GWAS结果的协调
共有112个SNP被鉴定为独立信号(在前哨SNP两侧使用r2<0.05和≥ 1 Mb进行LD聚集),代谢组广泛调整GWAS显著,代谢物GWAS中至少20个氨基酸中的1个。与跨平台GWAS一致,我们使用p值<4.9×10−10来选择与一个或多个氨基酸强相关的SNP。该 p 值阈值考虑了全基因组分析和测试的多种表型产生的多次测试,计算方法是常规 GWAS p 值阈值除以解释 Fenland 研究中 174 种代谢物中 95% 变异的主成分数量(即,代谢组范围调整的 GWAS p 值 = 5 × 10−8/102 = 4.9 × 10−10)。
为了确保每个氨基酸的SNP检测的统计独立性,我们通过使用1000 Genomes Europe参考panel,在10,000 kb的窗口内进行了更严格的LD聚集,截止值为r2<0.01。结果,112 个 SNP 中有 110 个通过了 过滤,并被用作 20 个氨基酸中至少一个氨基酸的仪器。
我们估计了所选遗传变异的氨基酸之间的成对相关性,以评估氨基酸之间的潜在遗传相关性。为此,我们使用上述 110 个选定 SNP 的列表来提取先前发表的 GWAS,27,28 汇总数据中存在的氨基酸的 SNP-氨基酸效应估计值,其中 8 个氨基酸浓度通过 NMR 波谱测量,另外 7 个氨基酸通过 MS 代谢测量两个 GWAS, 分别。然后,我们分别计算并可视化了不同氨基酸测量平台(即 NMR 和 MS Metabolon)的氨基酸之间的成对相关系数。
对于110个选定的SNP,我们在GWAS中检索了母体遗传对后代出生体重影响的SNP出生体重关联汇总数据。出生体重GWAS中不存在5个SNP(rs8061221、rs4253272、rs1065853、rs72661853和rs142714816),其中4个SNP在高连锁不平衡(LD)中可以识别出代理SNP(rs7187819、rs4253282、rs7412、rs112748538)(详情见表S1)。没有找到rs142714816的代理SNP,这被排除在进一步的分析之外(表S1)。
我们使用 TwoSampleMR R 包的“harmonise_data”功能协调了 SNP 暴露和 SNPoutcome 关联数据。32 在数据协调过程中,删除了 3 个回文 SNP(rs28601761、rs2422358 和 rs1935),MAF 分别为 0.42、0.44 和 0.48,因为我们无法明确地协调它们。最终,选择了 106 个 SNP 作为 19 个氨基酸的遗传仪器(数据协调后没有可用的半胱氨酸遗传仪器)。SNP氨基酸关联有相当大的重叠,分别有6个氨基酸与rs715相关,7个氨基酸与rs1260326相关,2个氨基酸与其他SNP相关,如图S1所示。
统计分析
对于主要的MR分析,我们使用Wald比率(对于谷氨酸和蛋氨酸,因为两个氨基酸中的每一个只有一个SNP),以及所有其他氨基酸的乘法随机效应逆方差加权(IVW)方法33,34,以估计母体循环氨基酸对后代出生体重的因果效应。这两种方法都假设所有工具都是有效的(例如,没有水平多效性),即使 IVW 在某些违反 IV 假设的情况下(即平衡水平多效性)仍然可以产生无偏估计值。在这项研究中,我们专注于效应大小和精确度,并将 pvalues 解释为证据强度指标。
所有统计分析均使用 R(4.0.2 版)进行。
MR敏感性分析
我们进行了一系列敏感性分析,以评估核心孟德尔随机化假设的合理性(即,SNP是测试母体循环氨基酸对后代出生体重影响的有效且强大的工具)。
仪器有效性
当一个特定的氨基酸有多个遗传仪器可用时,我们使用留一分析检查是否存在异常值SNP。对于具有五个或更多SNP作为工具变量的氨基酸,我们计算了库克距离,以确定是否有任何单个SNP对使用4/SNP数量的临界值的分析结果具有不成比例的影响。我们使用Cochrane的Q统计量来检查SNP特异性因果估计之间的异质性。异常SNP的存在和SNP之间的显著异质性可能表明水平多效性。当有五种或更多遗传工具可用于特定氨基酸时,我们执行了对水平多效性更稳健的 MR 方法,例如加权中位数 20 和 MR-Egger 回归。37 加权中位数法假设分析中超过50%的权重来自有效工具,并且对异常值的影响更稳健。与IVW不同,MR-Egger不会将SNP-氨基酸和SNP-出生体重关联之间的回归斜率限制为零。这意味着,只要 INSIDE(“独立于直接效应的仪器强度”)假设成立,斜率(因果效应的 MR 估计值)有望在不平衡的水平多效性的情况下得到校正。来自MR-Egger的非零截距表示不平衡的多效性。我们将这些MR方法的结果一致性与我们的主要分析结果进行了比较。
此外,我们进行了“保守 MR 分析”38,其中我们仅选择了定位到参与氨基酸代谢途径(例如,氨基酸生物合成或降解)的基因的 SNP。与在基因调控中作用未知的 SNP 相比,调节这些基因表达/功能的 SNP 更有可能成为循环氨基酸孟德尔随机化分析的可靠工具。根据代谢物GWAS工作24中报告的结果,我们优先考虑SNP进行保守的MR分析,其中他们使用两种方法(无假设遗传方法和基于生物学知识的方法)来优先考虑观察到的与代谢物的遗传关联的可能致病基因(详细信息可以在24中找到)。就我们研究的重点氨基酸而言,我们进一步查找了Pathway Commons数据库中与氨基酸相关的这些优先基因列表,39以确认这些基因的功能是否直接参与氨基酸代谢的调节。使用了一个主要的选择标准:可以在该数据库中策划的众多数据源中的至少一个数据源中识别出相应的氨基酸代谢途径,这反映了特定氨基酸的优先基因直接参与该氨基酸代谢。对于那些在相应氨基酸代谢途径中确认其功能作用的优先基因,我们将它们纳入生物学或遗传保守的 SNP 集,以使用 Wald 比率法或乘法随机效应 IVW 方法进行 MR 敏感性分析。将结果与MR主要分析结果进行比较。
最后,应评价员的要求,我们探讨了由于体重指数(BMI)或吸烟(即,氨基酸的遗传变异影响BMI/吸烟,进而影响出生体重,与特定氨基酸无关)是否可能存在偏倚。我们检查了每种氨基酸对出生体重的因果效应,分别在多变量 MR (MVMR) 分析中调整了母亲 BMI 和终生吸烟。40 从171,977名妇女的BMI上提取了关于母亲BMI的全基因组数据摘要欧洲血统由神经性状遗传调查 (GIANT) 联盟进行。41 从参与英国生物银行研究的 462,690 名欧洲血统的个体中提取了关于终生吸烟的全基因组摘要数据。共获得 37 个用于母亲 BMI 的 SNP 和 126 个用于终生吸烟的 SNP 仪器。氨基酸、BMI 和终生吸烟的遗传变异相互协调,并与出生体重的遗传变异相互协调,其中对所有暴露(即氨基酸和 BMI/终生吸烟)的组合仪器集进行了额外的一轮 LD 聚集,阈值为 r2 < 0.001 在 10,000 kb 窗口内,以确保仪器的独立性。MVMR分析按照Sanderson等人的描述进行,40其中与每次暴露的遗传关联之间的协方差固定为零。此外,我们计算了条件 F 统计量来评估工具的强度。MVMR 分析是使用 R 的 MVMR 包进行的。
仪器强度
为了评估 MR 分析中的仪器强度,在 MR-Egger 回归的情况下,我们计算了每个遗传仪器的 F 统计量和每次暴露(即氨基酸)的 I2GX 统计量。44 I2GX 的高值(通常大于 0.9)表明由于 MR-Egger 因果估计中的测量误差,相对偏差小于 10%,这相当于传统工具变量分析中 F 统计量大于 10 的情况。
遗传仪器的相关性
我们对这项研究的兴趣是怀孕期间母体循环氨基酸是否会影响胎儿生长,从而影响出生体重。我们从在一般人群(结合女性和男性)中进行的GWAS中选择了SNP,假设这些SNP是我们的目标人群(即孕妇)的相关工具。我们通过测试氨基酸仪器在预测怀孕期间母体循环氨基酸的相关性来评估这一假设的合理性。我们只能确定一个具有母体基因型和妊娠期间测量的循环氨基酸的队列(BiB队列)。在BiB中,在妊娠24-28周时,作为NMR代谢组学分析的一部分测量氨基酸(更多细节见25)。有9个氨基酸和2966名欧洲血统女性的数据。氨基酸水平首先进行自然对数转换,在 5 SD 时胜过并转换为 Z 评分,然后根据母亲年龄和基因组数据中的前 10 个主要成分进行调整。每个得到的残差都根据主要 MR 分析中使用的相应 SNP(遗传仪器)进行回归。从该分析中估计了总共 89 个 SNP-氨基酸关联。除了将GWAS关联与BiB中的等效关联进行比较外,我们还将它们与Fenland研究中的相同关联(非孕妇)进行了比较。除了比较GWAS、BiB和Fenland之间的个体SNP关联外,我们还比较了三个不同数据源中每个氨基酸的遗传仪器-氨基酸关联的荟萃分析估计值。
道德声明
BiB 的伦理批准已获得布拉德福德研究伦理委员会的批准。已获得所有参与者的书面同意。芬兰研究获得了国家卫生服务局(NHS)卫生研究局研究伦理委员会(NRES委员会-英格兰东部剑桥中心,参考文献04 / Q0108 / 19)的批准,所有参与者都提供了书面知情同意书。本研究仅使用其汇总水平数据。
资金来源的作用
资助者在研究设计、数据收集、分析或解释,或与研究相关的任何方面都没有作用。
结果
氨基酸之间的成对遗传相关性
使用来自多达 86,507 个个体的数据,我们选择了 112 个 SNP(p < 4.9 × 10−10)和独立(r2 < 0.05 和 ≥ 1 Mb)与 20 个氨基酸中至少一个氨基酸的血液浓度相关(表 S2)。在更严格的LDclumping(10,000 kb窗口内r2<0.01)之后,使用110个独立遗传变异的列表,我们根据先前发表的GWAS的汇总数据计算了SNP-氨基酸效应估计的成对相关系数。我们能够从 Kettunen 等人进行的 GWAS 中提取 108 个 SNP-氨基酸效应估计值,包括 8 个 NMR 波谱测量的氨基酸浓度(丙氨酸、谷氨酰胺、组氨酸、异亮氨酸、亮氨酸、苯丙氨酸、酪氨酸和缬氨酸)。Shin 等人从 GWAS 中测量了 7 个 MS 氨基酸(天冬酰胺、甘氨酸、赖氨酸、蛋氨酸、脯氨酸、丝氨酸和色氨酸)的 27 和 72 个 SNP-氨基酸效应估计。
我们计算了每个测量平台上氨基酸之间的成对遗传相关性,结果如图1所示。支链氨基酸(BCAA;缬氨酸、亮氨酸和异亮氨酸)彼此高度相关(r = 0.77–0.91),丝氨酸和甘氨酸也强相关(r = 0.65)。这些结果指出了循环氨基酸遗传调控的聚集性,这可能反映了氨基酸之间共享的代谢途径。例如,缬氨酸、亮氨酸和异亮氨酸通过一系列由相同酶催化的反应代谢,以生成柠檬酸循环(也称为三羧酸循环或克雷布斯循环)的中间体(图 S2)。因此,该途径的活性越高/越低,都会影响三种支链氨基酸的浓度。同样,丝氨酸和甘氨酸由于它们的相互转化而交织丝氨酸和甘氨酸由于它们的相互转化而交织在一起,作为单碳代谢的一部分,这对于参与表观遗传调控的核苷酸合成和甲基化反应至关重要,丝氨酸在甘氨酸代谢途径中强烈参与甘氨酸生物合成(图 S3)。
用于循环氨基酸的遗传变异仪器
在110个选定的遗传变异中,有5个在出生体重GWAS中不存在,但是我们为其中4个确定了代理SNP(r2 ≥ 0.8)(找不到rs142714816的代理); 这导致在数据协调后,总共有 106 个 SNP 作为 19 个氨基酸的遗传工具(3 个回文 SNP 被移除,并且没有可用的半胱氨酸遗传变异检测)(表 S3).这些遗传变异解释了循环氨基酸的变异比例,范围从0.13%(谷氨酸)到4.76%(天冬酰胺)(表S4)。
母体氨基酸对后代出生体重的因果效应估计
主要发现
在主要的MR分析中,有证据表明母体丝氨酸(每SD高丝氨酸,95%CI:9,46)和谷氨酰胺(59g,95%CI:7,110)对后代出生体重有积极的因果关系。还有证据表明苯丙氨酸(-25 g,95% CI:-47,-4)和亮氨酸(-59 g,95% CI:-106,-11)对后代出生体重有反向因果关系。没有强有力的证据表明剩余氨基酸对后代出生体重的因果影响(图2 和 表S5)。然而,尽管使用了最大的可用数据集,但一些因果效应的估计并不精确,因此,我们不能放弃某些氨基酸(如丙氨酸)的生物学意义效应的存在(43 g,95% CI:-14,100)。
敏感性分析,探索水平多效性可能引起的偏差
SNP异质性之间。如果针对特定氨基酸的所有 SNP 检测都是有效的(即,没有水平多效性效应),我们预计效应估计在 SNP 之间是一致的。为了评估这一点,我们对具有多个遗传工具的氨基酸进行了leave-one-out 分析,并计算了具有五个或更多遗传工具的氨基酸的库克距离。Cochrane的Q统计量用于检验因果估计中的SNP异质性。
根据对留一分析结果的目视检查(图S4),Cook距离的定量和Cochrane的Q统计量表1和表S6),有证据表明某些氨基酸之间存在SNP异质性。几个基因中或附近的SNP(Lotta等人进行的GWAS中鉴定的遗传优先基因。24)确定了导致这种异质性的原因(表1)。其中一些位点,如GCKR(调节葡萄糖激酶)和CPS1(催化尿素循环的初始步骤,负责氨基酸降解和尿素合成的途径),在以前的研究中已被报道为多效性的,45,46而其他位点,如GLS2和PPM1K-DT,已被发现在谷氨酰胺和支链氨基酸的调节中起关键作用。
MR-Egger和加权中位数分析。为了探索这些异质性SNP是否在我们的主要分析中引起偏倚,我们进行了MR敏感性分析,这些分析对无效工具(即加权中位数和MR-Egger回归)更可靠。这些需要多个 SNP 仪器,并且对 19 个氨基酸中的 13 个进行了,其中 5 个或更多 SNP 可用作遗传仪器(图 2)。加权中位数和 MR-Egger 回归分析得出的结果与主要 IVW MR 分析的结果大致一致(图 2)。唯一的例外是丙氨酸的结果,在主要的IVW分析中,丙氨酸对后代出生体重有积极影响,具有广泛的置信区间,包括零区间,但在MR-Egger分析中,尽管极宽的置信区间也包括零区间,但揭示了反向效应量。MR-Egger截距还表明,丙氨酸的IVW结果可能因不平衡的水平多效性(p = 0.02)而产生偏差(表S7)。对于可以进行MREgger的所有其他氨基酸,没有强有力的证据证明水平多效性不平衡(所有MREgger截距p值>0.05)。
保守的MR分析
除了这些敏感性分析外,我们还通过尽可能进行保守的 MR 分析来探索由于水平多效性导致的潜在偏差。与定位于已知具有高度多效性(例如 GCKR)或在氨基酸代谢中作用未知的基因的 SNP 相比,定位于直接参与氨基酸代谢的基因的 SNP 更有可能成为测试循环氨基酸影响的有效工具。因此,我们定义了保守的SNP集(即SNPs,这些SNPs是更可靠的循环氨基酸工具),并基于这些s进行了MR分析(IVW或Wald比率)。这是通过将遗传仪器限制为那些具有既定遗传或生物学功能的仪器来实现的,这些仪器表明对特定氨基酸有直接的因果关系。
根据生物学合理性(方法部分详述的选择标准)选择了 21 个检测 13 个氨基酸的 SNP,并根据遗传功能选择了另外 20 个检测 14 个氨基酸的 SNP(表 S8)。如图 2 所示,与主要 MR 分析的结果相比,保守分析产生了大致一致的结果。母体丝氨酸对后代出生体重的积极影响在生物学和遗传优先的仪器中均得到证实。在保守分析中观察到天冬酰胺和天冬氨酸的逆向效应,这在主要的MR分析中并不一致。此外,谷氨酰胺和一些支链氨基酸(即亮氨酸和异亮氨酸)的效应估计在保守分析中减弱。
MVMR 分析,调整母亲 BMI 和吸烟。在对母亲BMI进行MVMR调整后,母亲循环氨基酸对出生体重的因果影响,以及(单独)终生吸烟的因果关系与主要的未经调整的MR分析一致,但有一个例外,表明由于母亲BMI/吸烟的水平多效性引起的偏倚不太可能解释我们的大多数结果(图3).唯一的例外是脯氨酸对出生体重的潜在影响。在我们的主要MR(未经调整)分析中,没有强有力的证据表明脯氨酸对出生体重有影响(平均出生体重与SD高脯氨酸的差异:9 g,95%CI:-46,65)。然而,在调整母体 BMI 的 MVMR 分析中,这增加了 9 倍以上,产生了强烈的积极影响 (87 g,95% CI:11,163)。MVMR分析结果与终生吸烟调整(8 g,95%CI:-10,26)与主要未调整的估计值一致。调整BMI后,条件F统计量范围为2.03(谷氨酸)至168.92(甘氨酸),调整终生吸烟后为1.40(谷氨酸)至74.19(甘氨酸)(每个氨基酸的条件F统计量可在表S9中找到),表明MVMR分析中可能存在弱仪器偏倚。
分析以探索仪器强度
主要IVW MR分析中的仪器强度通过F统计量进行评估,另外还计算了I2GX统计量,以量化违反“无测量误差”(NOME)假设的强度,如果大于0.9,则不会对MR-Egger回归估计产生重大影响。44 F 统计量范围为 38.74 至 7504.06,每个氨基酸的 SNP 平均 F 统计量范围为 41(谷氨酸)至 633(甘氨酸)。对于进行MR-Egger回归分析的氨基酸,I2GX的范围为0.67至0.99(丙氨酸、组氨酸、异亮氨酸、亮氨酸和苏氨酸的I2GX<为0.9,其余氨基酸的I2GX>0.9)(仪器强度表S4:F统计量和I2GX),表明由于潜在的效应稀释,应谨慎解释前5种氨基酸的MR-Egger分析估计值。
测试遗传仪器与母体妊娠氨基酸的相关性
本研究中用作氨基酸遗传工具的SNP是从迄今为止在非孕妇和男性中完成的最大的GWAS中获得的。如果女性与氨基酸的遗传关联明显不同,并且男性,或怀孕期间的女性,我们的MR结果可能有偏差。为了探索这一点,我们将GWAS中所有89个与氨基酸的遗传关联与仅(未怀孕)女性样本(来自芬兰研究的N = 4407名欧洲人)和一组女性(N = 2966)中的等效关联进行了比较,并在妊娠26-28周时测量了氨基酸(BiB队列)。在所有三个样本中,共有67个遗传关联是一致的(图4;异质性p > 0.05)。对于其余22个关联,有一些异质性的证据(p范围从3.72E-62到0.04)。异质性的原因之一可能是BiB研究中某些SNP的插补质量低,如rs4801776(插补质量评分INFO = 0.54)、rs1935(INFO = 0.65)和rs2168101(INFO = 0.69),这些SNP-氨基酸对在图4中被描述为极度异质。异质性的另一个原因是特定变体和氨基酸之间存在性别特异性效应。例如,据报道,变体rs715对甘氨酸的影响大小存在显着的性别差异(女性的遗传关联程度高于男性),46在我们的研究中,BiB孕妇,芬兰非孕妇和GWAS普通人群(孕妇和非孕妇都高于一般人群)之间的幅度差异证实了这一点,如图4所示.在考虑了上述潜在原因后,三个数据源与氨基酸的遗传关联大致一致,这为本研究中使用GWAS汇总数据中的热门数据作为母体妊娠循环氨基酸的遗传工具提供了证据。在比较遗传仪器的荟萃分析估计值时,证实了一致性——除甘氨酸、苯丙氨酸外的三个不同数据源的暴露关联,其中观察到芬兰非孕妇的估计值与一般人群的GWAS结果之间存在显著的异质性(图S5)。
讨论
在本研究中,我们使用双样本 MR 分析和近期代谢物和出生体重 GWAS 的数据探索了 19 种母体循环氨基酸与后代出生体重之间的因果关系,分别包括多达 86,507 名和 406,063 名参与者。我们的研究结果支持母体循环谷氨酰胺和丝氨酸对后代出生体重呈阳性,亮氨酸和苯丙氨酸对后代出生体重呈负影响。这些 发现得到了一系列敏感性分析的广泛支持,这些分析探讨了由于可能违反 MR 假设而导致的偏倚。尽管使用了迄今为止最大的GWAS来测量氨基酸和出生体重,但应该注意的是,对于某些氨基酸,估计值不精确,并且由于所选SNP的数量较少或缺乏选定的SNPs映射到直接参与氨基酸代谢的基因,因此无法进行关键的敏感性分析。
谷氨酰胺和谷氨酸是非必需氨基酸,在分解代谢应激状态下成为条件必需氨基酸,包括怀孕,因为胎儿需求超过母体合成。47 我们的保守 MR 分析和对文献的回顾表明,母体谷氨酰胺对后代出生体重的积极影响可能是同工酶依赖性的。48,49 具体来说,当谷氨酰胺在 GLS2 中由错义变体 rs2657879 检测时,有证据表明有很强的积极效应,而当用 rs7587672(GLS 的 eQTL)检测时,存在不精确的反向效应(图 S6A)。由于 GLS2 编码催化谷氨酰胺转化为谷氨酸和氨的酶,并且主要在肝脏中表达(即肝型同工酶),而 GLS 编码肾脏型同工酶,我们假设怀孕期间循环谷氨酰胺水平对后代出生体重的总体正因果关系可能主要由肝脏型同工酶机制驱动。这间接得到了rs17602430(SLC38A2)(图S6B)驱动的正结合的支持,rs17602430(包括谷氨酰胺)是系统A中的钠依赖性中性氨基酸转运蛋白。
在怀孕后期,甘氨酸在胎儿生长中起着至关重要的作用,因为它是DNA和其他分子合成和甲基化所必需的一碳的主要来源。52 然而,有证据表明,甘氨酸在人体胎盘中的运输相对较差,胎盘甘氨酸的供应被认为低于胎儿的需求。53 据推测,在绵羊和人类妊娠示踪剂研究的一些支持下,母体循环丝氨酸不是通过胎盘运输到胎儿循环的,而是在子宫胎盘组织内用于合成甘氨酸,并通过这种机制使
对胎儿甘氨酸供应的重要贡献。54,55 我们的研究结果似乎支持这一假设,即发现母体循环丝氨酸对后代出生体重的因果作用,但几乎没有证据表明母体循环甘氨酸对后代出生体重的因果影响。对于甘氨酸,基于两个 SNP rs17591030 (GLDC) 和 rs9923732 (GCSH) 的保守分析结果(图 S7)不支持其因果效应,尽管基于 rs561931 (PHGDH) 和 rs4947534 (PSPH) 的结果表明有积极作用。造成这种情况的原因可能是所涉及的不同生物学途径。GLDC 和 GCSH 位点参与甘氨酸降解,而 PHGDH 和 PSPH 编码参与丝氨酸从头生物合成的酶。46 鉴于丝氨酸和甘氨酸的相互关联的代谢,这可能解释了使用 PHGDH 和 PSPH 估计时观察到的甘氨酸对出生体重的潜在积极影响,与 GLDC 和GCSH中。对此的进一步探索,例如,使用多变量MR可能很有价值,但需要大量的样本。
与谷氨酰胺、丝氨酸和甘氨酸不同,谷氨酰胺、丝氨酸和甘氨酸是非必需氨基酸,使用钠依赖性 A 系统进行胎盘转运,而支链氨基酸(包括缬氨酸、亮氨酸和异亮氨酸)则使用钠依赖性 L 系统,并更快地穿过胎盘。56 先前的研究报告说,母亲体内必需氨基酸(包括支链氨基酸)浓度较高,与宫内生长受限妊娠的风险较高有关。7,57 在本研究中,在主要的 MR 分析中发现母体循环亮氨酸对后代出生体重的负向影响,这与敏感性分析的估计在方向上一致(尽管效应估计被减弱)。亮氨酸已被提议通过激活雷帕霉素的细胞内哺乳动物靶标 (mTOR) 信号通路作为胎儿肌肉蛋白质合成的调节剂。58-61 此外,在以前的 MR 研究中,较高的循环支链氨基酸与较高的 2 型糖尿病风险有关62,并且已证实母体血糖升高会增加后代出生体重。17 因此,预计 BCAA 水平与后代出生体重之间存在正相关,但有趣的是,这项研究的结果提供了相反关系的证据,这在最近的代谢组学研究中也观察到。63 鉴于支链氨基酸代谢涉及的复杂生物学机制及其与胰岛素抵抗的密切联系,64,65 有必要对大量妊娠进行进一步的 MR 研究,以剖析母体空腹胰岛素和循环支链氨基酸对后代出生体重的影响。
对于苯丙氨酸,我们的主要 研究结果表明对后代出生体重有负向影响,这得到了不同敏感性分析方法中相似但不精确的影响估计的支持。一项针对 20 对双胞胎的小型观察性研究表明,与适合胎龄双胞胎相比,胎龄双胞胎中小胎 L 运输的氨基酸(包括苯丙氨酸)的胎儿循环浓度显着降低,尽管这两组之间没有观察到母体氨基酸浓度的差异,66 ,我们没有在同一关联的较大样本中发现其他研究。需要进一步的研究来更好地了解我们发现的潜在机制 。
对于苯丙氨酸,我们的主要 研究结果表明对后代出生体重有负向影响,这得到了不同敏感性分析方法中相似但不精确的影响估计的支持。一项针对 20 对双胞胎的小型观察性研究表明,与适合胎龄双胞胎相比,胎龄双胞胎中小胎 L 运输的氨基酸(包括苯丙氨酸)的胎儿循环浓度显着降低,尽管这两组之间没有观察到母体氨基酸浓度的差异,66 ,我们没有在同一关联的较大样本中发现其他研究。需要进一步的研究来更好地了解我们发现的潜在机制我们研究的局限性之一是出生体重GWAS数据的一个主要组成部分,即英国生物银行研究,该研究占出生体重GWAS样本量的80%,出生体重由母亲回顾性报告。
此外,由于英国生物样本库在招募时的反应率较低(∼5%),潜在的选择偏倚可能是遗传关联研究和随后的 MR 分析中的一个问题。67 最后,我们的研究集中在母体遗传变异上,这些变异调节母体循环中氨基酸浓度,以及对胎儿生长的潜在影响;然而,氨基酸对胎儿生长的影响可能是由于母体、胎儿和胎盘机制的复杂相互作用造成的,这应该在未来的研究中加以探索。例如,有越来越多的证据表明,母体代谢通过调节胎盘转运机制影响母体循环氨基酸,但也影响胎儿氨基酸的摄取,68-70,因此我们的结果应谨慎解释。
总之,我们的 研究结果表明,母体遗传预测的谷氨酰胺和丝氨酸水平会增加后代出生体重,而亮氨酸和苯丙氨酸似乎会降低后代出生体重。尽管使用了最大的GWAS,但一些因果效应的估计并不精确,包括一些可能表明潜在重要 临床效应,例如丙氨酸。因此,需要更大的氨基酸GWAS和出生体重来复制我们的 发现,并阐明这些氨基 酸可能影响胎儿生长的机制。此外,这些效应的潜在机制可能涉及氨基酸如何通过胎盘运输以及胎儿反应及其基因型在影响胎盘传递中的作用。需要进一步的研究来深入了解这些机制。大规模、高质量的随机对照试验是确定在怀孕期间干预母体循环氨基酸(例如,通过补充)是否是优化胎儿健康生长的有用策略的关键。