医学生速看!挑战7天完成一篇NHANES,Day 2!

挑战丝毫不能停,Day2主要任务:了解数据库结构+数据提取不管是NHANES数据库、还是MIMIC数据库、还是eICU数据库。。。任何一个公开数据库第一步都需要了解数据的储存结构NHANES数据库的最大特点是数据获取简单这在现在这个“数据为王”的时代多么重要也就是说了解了数据的结构,数据的清洗就会非常容易MIMIC以前也尝试过,不过数据量太大了导致数据安装需要非常长的时间,不太友好NHANES就没有这个烦恼 有那些数据,才能知道我可以利用些什么样子的数据从网站上我们可以看到,数据内容非常丰富里面有很多不同的年份,比如“2011-2012”,我们叫一个周期每两年进行一次调查并上传数据每一个周期有包括了:人口统计学、饮食数据、体格检查、实验室数据、问卷调查和Limited Access DataLimited Access Data数据需要申请,需要申请获批后才能使用但是前面5个板块的数据对于我们发相关的SCI文章已经绰绰有余 以demo数据示例:点击进去后就可以看到Doc File和Data File,Doc File是这个数据集的基本介绍比如每一列(也就是每一列的指标代表什么意思、具体如何测量、数据中的123分别代表什么)点击Data File就能下载到该数据,然后利用R或者SPPS就能打开这个XPT的数据集文件 了解这个对于我们写NHANES文章有什么作用呢?比如我现在我关注的指标是TyG通过文献检索发现TyG是一个复合指标TyG=Ln [TG (mg/dL) × FBG (mg/dL)/2]我需要下载TG和FBG再通过上面的公式进行计算TG和FBG肯定都在实验室数据里面我就去Lab Data的Doc File查看并下载因为后面也会用得到NHANES里面的数据,如果自己每次做一个研究就需要从里面下载相关的数据就会非常的麻烦所以我在前期花了一些时间把NHANES中所有的周期的所有数据全部下载到本地后续的数据提取就可以直接用代码提取,会非常的方便 好啦,今天的分享就到这里啦!

不同数据库,研究方法一样吗?

文章题目:Association of Cardiovascular Health Score With Early- and Later-Onset Diabetes and With Subsequent Vascular Complications of Diabetes  DOI:10.1161/JAHA.122.027558 中文标题:心血管健康评分与早期和晚期糖尿病及糖尿病后续血管并发症的关系 发表杂志:J Am Heart Assoc 影响因子:1区,IF=5.0 发表时间:2023年1月…

今天给大家分享一篇在 2023年12月发表在《Diabetology & Metabolic Syndrome》(2区,IF=3.4)的文章

今天给大家分享一篇在 2023年12月发表在《Diabetology & Metabolic Syndrome》(2区,IF=3.4)的文章。本文这项研究利用了美国国家健康和营养调查(NHANES)2001–2018年的数据,探讨了胰岛素抵抗的代谢评分(METS-IR)指数与尿失禁(UI)之间的关系。暴露:本研究的暴露变量是METS-IR指数,这是一个新颖的评估胰岛素抵抗的指标,通过几个非空腹胰岛素的实验室指标和一个容易测量的人体测量参数来计算。结局:研究的主要结局是尿失禁的发生,包括压力性尿失禁(SUI)、急迫性尿失禁(UUI)和混合性尿失禁(MUI)。

医学生速看!挑战7天完成一篇NHANES,Day 1!

最近因为科室安排需要前往西藏路途中由于过于无聊回望走过的这些年“临床”和“科研”到底哪个重要?我想不出答案只知道:发文章不能停所以我在拉萨写下这次的挑战继上次挑战了meta分析和GBD,收获了非常高的关注度,本次挑战7天完成一篇NHANES数据库SCI! Day 1任务:明确目标期刊+初步检索NHANES数据库中包括了非常多的横断面调查数据包括了人口统计学、饮食数据、体格检查、实验室数据。。。这种基于公开数据库的挖掘的难点在于选题的时效性一定是有了想法就要马上去做只要确定可行性,具体的数据提取和数据分析都是体力活 选题:需要确定目标期刊、深入阅读目标期刊的文献比如Cardiovascular Diabetology杂志就非常喜欢 TyG(Triglyceride-glucose index)这个指标这也是我这次想要挑战的指标我换一个研究人群、换一个关联指标就是一篇新的文章我首先用“NHANES and Triglyceride-glucose index”进行了检索发现目前文章非常多,有132篇,且基本都是为高分文献因为我是心内科,所以就把132篇文章的X和Y分别提取出来发现我关注的Y还没有人写过所以就定下目标期刊为Cardiovascular Diabetology深入了解这个杂志,可不是水刊,最新的影响因子是1区8.5分所以最后就挑战TyG和一个心血管指标Y的相关性下载了几篇类似的文献深入学习目标期刊的风格(DOI: 10.1186/s12933-023-02115-9) 最后欢迎大家围观一起挑战一起写文章!我们明天见

挑战7天光速完成一篇药物靶向MR,Day 4-5!

进度汇报:寻找靶基因+跑代码+出图片药物靶向的代码非常的简单也非常的好理解,但是要注意的是要搞清楚整个过程中的思路第1步:明确蛋白与疾病表型存在明显的因果关系或者已知该蛋白能够有效作用于该疾病的治疗。第2步:寻找调节该蛋白表达的一类基因来模拟药物作用第3步:寻找到这个靶基因后获取其工具变量与疾病进行单变量MR分析。 这就是我们的药靶的文章设计思路很重要的一部就是寻找靶基因一般我们通过eQTL的网站无寻找eqtlgen因为基因表达的过程会受到很多的调控所以不仅要关注该基因,还要关注该基因的上下游1兆的基因信息 我的eGTL的数据来源于Genomic atlas of the proteome from brain, CSF and plasma prioritizes proteins implicated in neurological disorders,里面包括了来自人体血浆、CSF等的eQTL数据我对这些下载来的数据进行了预处理实际上本质就是本地数据的数据处理然后再用这些数据进行药靶MR的分析 然后再做一个共定位分析其实就是看暴露X与结局Y的GWAS summary中该区域的所有SNP的位置是不是基本一致的今日图表弄完啦,就要开始写作啦!

1 242 243 244 245 246 308