
冲刺一区!挑战5天完成一篇NHANES,Day 3!
进度汇报:下载数据+清洗数据
首先是数据的下载部分,

在前期我们已经将所需要的数据都整理在Excel表格中了,
而且所有周期的所有数据也都下载到本地了,
只需要用代码库库一顿提取就完事~
然后是数据的清洗部分,
这个部分也是根据Excel表格来,
比如年龄可以是连续变量,

也可以根据年龄段分成分类变量,
若是分类变量,那么每一类用什么数字来表示,
这些都需要在表格中标注清楚。
理清思路后就可以开始疯狂筛选啦!

整理好了数据以后,后面的分析实际上是非常简单的,
选题才是最重要、最费时间的,
也是最容易浮躁滴,静下来,方向对了,就一定能出成果。

今日份挑战成功~大家都进展到哪一步了呀~
