本期王师兄带来了前段时间医学科研圈重磅话题-孟德尔随机化分析 这次将揭开孟德尔随机化这面神奇面纱,带领大家走进孟德尔随机化分析的世界! 孟德尔随机化(Mendelian randomization,简称MR)是一种基于全基因组测序数据(GWAS数据),利用单核苷酸多态性,即SNP作为工具变量并揭示因果关系的新型流行病学方法。 如今的孟德尔随机化分析被称为下一个Meta分析,同样是不用做实验就能发的sci类型如果你也想发孟德尔随机化sci文章,可以后台私信我们,师兄带你一路打老虎 欢迎联系我。
代码包优化完整,边界条件提示等都有对应的中文提示,大家可以自行判断。没法判断的报错,请截图找咨询的老师,截图要全面,不要只截一小部分,方便判断问题。 注意1:没有直接赋值的字符串,请用双引号括起来,否则语法错误(”字符串内容”)!!!只要不是数值,或者你自己声明的变量,都是字符串类型,都要加双引号什么是自己声明的变量? a=1 这样a就是你自己声明的数值为1的变量注意2:把本地文件的文件名尽量改短,且不要有空格,避免文件名过长过复杂,R语言抽风注意3:R4.3以上,对中文路径或者文件名不是很兼容,容易抽风识别不了,请改成英文。 欢迎联系我。
MendelR包的各种方法,里面共同的参数定义说明: p1 挑选与暴露相关的SNP 默认 5e-8(不要大于1e-5)p2 过滤与结局相关的SNP 默认 5e-5rm_snps 过滤混杂 F值 离群值 需要去除的SNPrun_presso 是否打开MRPRESSO分析r2 连锁不平衡 (不要大于0.3,越大越宽松)kb 连锁不平衡(不要小于100,越小越宽松)local_clump 是否打开本地clump 关于T和F的取值,就相当于是或否的意思,即代表一个开关T=TRUEF=FALSE跑mr分析最好保持默认的条件,最严格的筛选显著的p值,以及去除连锁不平衡需要放宽的,一般是没有足够的snp,做不了mr分析,这时候要去放大p1值,纳入更多的暴露工具变量,适当调整r2和kb,减少连锁不平衡去除的snp优先级p1>r2=kb>p2如果是阴性结果,我们要求选题必须要有明确的临床意义,去讨论结果,以及要把文章写好,否则直接舍弃 怎么加参数?增加参数格式,参数名=具体数值,如果是字符串(非纯数字类型),则需要增加双引号。 欢迎联系我。
来自血细胞联盟Blood Cell Consortium(BCX)的六种白细胞可以正反向分析 注意使用该数据,需要引用数据Trans-ethnic and Ancestry-Specific Blood-Cell Genetics in 746,667 Individuals from 5 Global Populations, Cell 2020自己按需修改正向分析的结局,和反向分析的暴露即可可兼容在线数据ID(最好下载到本地,开启local_clump=T),或者本地GWAS数据,可一键分析出所有结果以上方法需要更新到最新版本执行mr_update()更新即可 欢迎联系我。
在做孟德尔分析的过程下,下载下来的文件格式多种多样,但其实就是两大类一种是二进制格式的文件,这种格式包含各种压缩文件,以及需要对应软件才能打开的文件,比如excel二进制文件需要使用特定软件打开才能正确读取里面的数据在R语言里面也可以使用一些特定代码进行读取,但是不推荐因为除了在R语言里面才看到数据的信息,不利于数据的预处理,以及表头的确认一种是纯文本文件。 纯文本文件的格式多为.txt .tsv .csv也有可能不带任何的后缀,文本文件类型和后缀不是强关联(所有的文件类型其实和文件后缀都无关,文件后缀只是辅助用户判断是个什么文件)(后缀改变不会改变数据的格式,就算把后缀扩展名删了也一样,这个还可以随意改,只要能用文本软件打开且没有乱码,就是文本文件)实际的数据分割符,要打开来查看,一般常见的分隔符就是制表符\t,csv常用的逗号分隔符, 空格分割符等 欢迎联系我。
注意大小写要完全一致!!!注意大小写要完全一致!!!注意大小写要完全一致!!! SNP:rsid号(rs123456这种,没有的话查看课程中转换risd的方法)effect allele:等位基因 A1(alt–effect allele–A1)具体要确认GWAS的数据描述,一般就是这样other allele:次要等位基因 A2eaf :主要等位基因频率(不一定要有,主要影响harmonise,和计算F值)eaf=effect allele frequency = freq = alt_AF(allele frequency)beta:beta效应值 = log(or) (别名effcet、b、beta)反正就是当前位点的效应值(odds ratio 对应or值,可以转换成beta)se:针对效应值的标准误(standard error)pval:统计学p值以上是大部分GWAS数据表头规律,正常判断需要结果数据下载时候的提供的描述确认,这个描述在下载的地方或者文章中提供,一般是readme文件,请确认好。总之,表头不能靠猜。 欢迎联系我。
工作目录设置有很多种方法,本文介绍最常见的几种方法为什么设置工作目录? 为了让代码执行时,从当前工作目录开始找数据,输出的结果也在工作目录,代码中的相对路径是以工作目录为起始去找对应的文件的(除非自己会弄绝对路径)总之要明确工作路径,不然会提示找不到文件。 欢迎联系我。
打开大数据文件需要使用EmEditor提示不能使用,或者不能正常选择分割符的时候,可以去百度搜一个EmEditor激活码升级,已经激活好的忽略。 Emeditor可以做很多数据操作,是个神器,可以减少代码操作,最大程度减轻医学生的代码压力。一、安装与激活安装完成后打开安装步骤,输入激活码激活DMAZM-WHY52-AX222-ZQJXN-79JXH能够正常使用分隔符内容,就算激活彻底完成需要放到代码中分析,请参照模板SNP的表头格式,修改表头二、拆分合并列注意:右键点击的位置一定要颠倒有序号的那一行的位置,填入的分割符号,一定要是英文的。拆分的话,选中需要拆分的列,右键选择拆分列按照实际的分割符拆分,其他都不用管,点确定。合并列也同理,选中多列后,选择合并列确定连接的字符,点确定即可,其他不用管三、选中筛选右键选中空白的,或者需要筛选的字符,选择筛选。 欢迎联系我。