柳叶刀:为什么不去关注GBD2023新数据?

说起GBD数据库(全球疾病负担),医学生们一定不陌生,它是全球最大、最详细的全球疾病、伤害和风险因素研究数据库之一,覆盖了全球204个国家和地区。

目前GBD官网只开源了2021以及之前的版本,GBD2023的数据还未完全开放,大家也很关心新的数据什么时候开放!

但是!已经有协作组的成员捷足先登了!

首篇用GBD2023数据的文章已见刊,而且是顶刊《Lancet》,妥妥宝藏数据库!

我们一起来看看这篇文章,学习作者的思路。

🟦 1 数据来源及思路

研究使用了GBD 2023数据估计了1990年至2023年按年龄和性别划分的204个国家/地区18岁之前接触针对儿童性暴力(SVAC)患病率,并报告了终身性暴力幸存者首次遭受性暴力的年龄。

通过在GHDx(GBD2023)、WHO全球妇女暴力流行率数据库、UN Women数据库中筛选符合条件的数据源(1980-2023年):

  • GHDx:全球健康数据交换所,包含各种全球健康数据,如GBD数据等。研究者审查了与针对儿童的性暴力或人际暴力有关的所有数据来源,并提取了符合纳入标准的数据来源,用于主要的流行率分析。
  • WHO全球妇女暴力流行率数据库:主要关注亲密伴侣暴力,包括身体暴力、性暴力等,研究通过对六个电子数据库进行系统性审查,并辅以针对性地手动检索灰色文献,研究性暴力/性暴力流行情况。
  • UN Women数据库:记录了联合国会员国及联合国组织为消除暴力侵害妇女行为所采取的行动,包含联合国会员国提交的相关监测系统、报告、调查、法律和立法。文章将GHDx和WHO全球妇女暴力流行率数据库与UN Women数据库进行了交叉对照。

最终确定了460个关于SVAC患病率的报告来源(女性451个,男性195个)。

🟦 2 统计分析

调整案例定义:

为了调整不同病例定义和研究方法下的数据偏差,文章使用了 MR-BRT(元回归贝叶斯正则化修剪)工具校正不同研究对SVAC定义的差异(如年龄界限、暴力类型)。例如,将“16岁以下”的案例调整至“18岁以下”的基准定义。

时空高斯过程回归模型(ST-GPR):

为了综合不同数据源的信息,文章使用了ST-GPR,生成包含位置、年龄和性别不确定性的完整时间序列。

  1. 第一阶段:拟合一个定制的线性回归模型,利用男性和女性的数据来预测SVAC的趋势。这样可以让全球SVAC暴露性别比例为后续模型和阶段的先验信息提供依据。
  2. 第二阶段:对第一阶段线性回归的残差在时间和空间上进行平滑处理,从而生成能够更好地贴合观测数据的非线性趋势。
  3. 第三阶段:把第二阶段得到的非线性趋势作为高斯过程回归中的均值函数,考虑到输入数据的方差,生成不确定性区间。这一阶段会考虑到外推数据点的不确定性增加的情况,并相应地降低它们的权重。
  4. 针对数据稀疏情况的补充:在数据极其稀疏的地点和世界区域,模型可能会出现对观测数据点过拟合的情况,从而导致终身患病率生成不合理的时序趋势。因此引入后续建模步骤,当缺乏观测数据时,用霍尔特线性趋势方法(扩展的简单指数平滑法)对初始ST-GPR模型进行预测和回溯,借助过去观测值的加权移动平均,且权重随着观测时间的推移呈指数减少,进而产生缓和的预测和平滑的时序趋势。

🟦 3 研究结果

1. 全球SVAC发生率:

2023年,全球20岁以上成年人SVAC的年龄标准化发生率为女性18.9%、男性14.8%,发生率与1990年的估计值相当。并且呈现地区差异,黑山(6.9%)的女性年龄标准化发生率最低,而所罗门群岛(42.6%)的女性年龄标准化发生率最高。在男性中,年龄标准化发生率最低的是蒙古(4.2%),然而,发生率最高的是科特迪瓦(28.3%)。

2023年20岁及以上女性(A)和男性(B)中SVAC的年龄标准化流行率

2. 首次发生性暴力经历的年龄:

7.7%的女性首次遭受性暴力发生在12岁之前,41.6%发生在16岁之前,67.3%发生在18岁之前。14.2%的男性在12岁时遭受过性暴力,47.6%在16岁时遭受过性暴力,71.9%在18岁时遭受过性暴力。

🟦 4 结语

该文章选择的是GBD2023最新数据进行研究,在时效性方面显示出创新价值,其能够发表在顶刊《Lancet》,新数据的优势功不可没!

并且文章使用MR-BRT调整偏差、ST-GPR综合不同数据源的信息等统计方法,进一步增加了文章的严谨性,使结果更可信。

好啦,大神的文章看完了,想必大家最关心的还是GBD新数据公开对外开放的时间

从历史更新规律来看,GBD数据库通常每年更新1次,数据一般延迟1-2年发布,2025年可获取GBD 2023数据。2025年3月7日,GBD 2023数据已对协作者开放。以往在协作者访问后,公众多在3-6个月后可获取,像2021年数据协作者访问后,公众于2023年秋季可查询。2023年无重大事件干扰数据收集、流程回归常规,综合判断,今年秋季公众便能访问GBD 2023数据。


目前GBD 2021数据发文量每日都在不断刷新,并非新数据一出来,之前的数据就没有研究价值了。

所以我们也可以先用老数据搞一篇文章出来,等到新数据开放后,直接替换数据,两篇文章到手 💪

对于纯小白选手来说,想要抓住这次机会,现在就可以开始学着入门了,多看文献积累思路。等到GBD开源,利用最新数据开展研究并发表文章具有很强的竞争力,一旦错过这个时间点,后续随着数据被挖掘分析,发表的工作量可能就会增加数倍。所以,大家关注下一下GBD2023的发布时间,把握先发优势!

Leave a Reply

Your email address will not be published. Required fields are marked *