挑战7天光速完成一篇NHANES，Day 3-4!

进度汇报：数据下载＋数据清洗。

Day2的时候我把所有的数据都下载好了，
现在就是数据清洗啦，
任何一个公开数据库最费时费力的就是数据清洗了
我打算用R来获取相关的数据。
获取的数据可以用来构建一个自己的数据库，
我换个指标，即换个指标、换个研究人群，
就又能有一篇新的文章。

在提取变量之前我们需要确定需要提取什么数据，
处理你重点关注的指标（X），和关注的疾病（抑郁，Y），还有一些协变量（Z），
具体需要哪些协变量可以根据既往的文献中获得。
我就提取了：年龄、性别、种族、教育程度、婚姻状况、贫困收入比率、体重指数（BMI）、肾小球滤过率（eGFR）、睡眠持续时间、饮酒、吸烟状况、心血管疾病、高血压、糖尿病、高脂血症和抗抑郁药使。
所以说，数据提取是公开数据库中最费时费力的，
但是有代码的话，也还好，毕竟一二区的文章也不是大风刮来的