挑战5天一篇NHANES预测模型 Day 2

虽然最近医院很忙,但挑战不能停~
第2天主要任务:提取数据前的准备


具体需要干的就是:
阅读5-10篇NHANES预测模型的文章
根据文章确定自己需要的变量
整理变量的具体信息
整理需要的数据
公开数据库有很多,如MIMIC、eICU数据库等
但是相较而言NHANES数据库的数据获取比较简单,
而且我们已经将所有的数据都下载到了本地,
大大缩短了我们提取数据的时间,
对我们这些“临床打工人”来说是非常友好的!


今天最主要的一步就是整理变量的信息,
在动手前,我一般会花几十分钟时间,
整体浏览一下这个数据库,
对于什么样的数据在demo里,
什么样的数据是在问卷里做到心中有数,
有些实在找不到的变量,
也可以去试试首页上的search variables。


变量信息整理好后,其实就完成了大半,
接下来要做的就是把需要的xpt文件整理好就好啦~
我们前期花了一些时间,
把所有的周期的所有数据全部下载到本地啦,
所以整理数据几分钟就能完成~


好啦,今天的分享就到这里啦!

Leave a Reply

Your email address will not be published. Required fields are marked *