Day3任务:数据下载+数据清洗任何一个公开数据库最费时费力的就是数据清洗了我打算用R来实现,比stata方便很多前期我就把所有的数据都下载好啦(非老大劲了)现在主要的目标就是进行数据清洗去我们下载好的数据中用R将所需要的数据提取出来但在跑代码之前我们得知道自己需要哪些数据,不然就算下载好的数据摆在我面前也无从下手~主要有三个方面:重点关注的指标X(HRR),关注的疾病(心血管疾病,Y),还有一些协变量(Z),具体需要哪些协变量可以根据目标期刊里既往所发表的文献中筛选获得并不是所有的协变量都需考虑进去,言之有理即可~我这篇文章主要包括以下协变量:年龄、性别、种族、教育程度、家庭收入与贫困比(PIR)、咖啡因摄入、总能量摄入、体重指数(BMI)、腰围、吸烟状态、饮酒状态、糖尿病、高血压和高脂血症。因为之前比较熟悉这个代码啦,所以提数据的时候很easy~用代码提啊提,用半天的时间就搞完了不过有些数据还是要做的细致一点的~比如说高血压看起来只有是和否,但实际上定义有很多:目前正在口服降压药或血压大于140/90mmHg,其中血压值是由受过培训的人员连续测量三个血压读数,并计算这三个读数的血压平均值。那么也就意味着,需要提取更多的数据来综合组成这个协变量工程还是很浩大滴!毕竟一区二区的文章也不是风刮来的但做多了也就熟练啦~猛猛一顿筛选就搞定!只要数据清晰了,后面的一切都好说,没什么复杂和困难的,重点就是选题(选择指标和idea)+数据提取这就是我花了很多的时间进行初步检索确定目标期刊、选题的意义千万不要一来就闷头开跑欢迎大家围观见证,在评论区留下自己的想法和经验,我们下一篇进度汇报见!
虽然最近很忙,但挑战不能停~第2天主要任务:数据库的基本认识+了解数据库的结构和内容都知道目前公开数据库有很多,如MIMIC、eICU数据库等但是NHANES数据库的比较特别的点在于:它数据获取相对来说比较的简单也就是说我们能很方便地下载到原始数据这对我们这些时间很紧张的“临床打工人”来说是非常友好的不过在下载数据前我们得先熟悉数据库的结构这是我们做任何一个数据库都需要先熟悉他有些什么数据知道数据库的数据组成了解数据下载的途径这样才能嘎嘎乱杀~从网站上我们可以看到NHANES数据库内容是非常丰富的之前试过MIMIC数据库,但数据量太大了,本地安装数据花了很长时间都没搞定NHANES就没有这个烦恼数据库里面有很多不同的年份,比如“2015-2016”我们叫一个周期,因为NHANES数据库每2年上传一次相关数据每一个周期里面有很多数据包括了人口统计学、饮食数据、体格检查、实验室数据、问卷调查和Limited Access Data我们最常用的是前5个板块Limited Access Data数据需要申请获得批准后才行但用前五个板块发文已经是绰绰有余啦~我们以Examination数据示例点击进去后就可以看到Doc File和Data File我们可以通过点击Doc File这列查看这个数据集的一些基本介绍点击Data File就能下载数据利用R或者SPPS就能打开这个XPT的数据集文件比如我要做的这个指标HRR通过将血红蛋白(Hb)浓度除以红细胞分布宽度(RDW)百分比来计算的。所以我就需要分别下载Hb浓度和RDW的数据然后再用上述公式计算。因为一个个数据下载很麻烦而且后面也会用得到NHANES里面的数据所以我前期花了一些时间把所有的周期的所有数据全部下载到本地啦哈哈哈这个工作量还是很大的不过以后要用数据就可以直接用代码提取啦!方便很多~好啦,今天的分享就到这里啦!我们下一篇进度汇报见!
文章题目:The global disease burden attributable to unsafe water, sanitation, and handwashing with unqualified facilities from 1990 to 2019 DOI:10.7189/jogh.14.04162 中文标题:1990 年至 2019 年因不安全的水、卫生设施和不合格洗手设施造成的全球疾病负担 发表杂志:J Glob…
今天给大家分享一篇在 2022年12月发表在《EClinicalMedicine》(1区,IF=9.6)的文章。本文这项研究利用了全球疾病、伤害和风险因素负担研究 (GBD) 1990-2019年的数据,对东地中海(EMR)地区(包括国家层面)的心力衰竭(HF)负担和根本原因进行了系统分析。研究方法:使用 2019 年全球疾病负担 (GBD) 数据来估计 EMR 中的 HF 患病率、残疾生存年限 (YLD) 和根本原因。按 5 岁年龄组(考虑 15 岁及以上)、性别(男性和女性)和国家比较年龄标准化患病率、YLD 和 HF 根本原因。
文章题目:Is systemic inflammation a missing link between cardiometabolic index with mortality? Evidence from a large population-based study DOI:10.1186/s12933-024-02251-w 中文标题:全身炎症是心脏代谢指数与死亡率之间缺失的联系吗?来自一项大规模人口研究的证据 发表杂志:Cardiovasc Diabetol 影响因子:1区,IF=8.5 发表时间:2024年6月 今天给大家分享一篇在 2024年6月发表在《Cardiovasc…