孟德尔随机化-常见文件格式
在做孟德尔分析的过程下,下载下来的文件格式多种多样,但其实就是两大类一种是二进制格式的文件,这种格式包含各种压缩文件,以及需要对应软件才能打开的文件,比如excel二进制文件需要使用特定软件打开才能正确读取里面的数据在R语言里面也可以使用一些特定代码进行读取,但是不推荐因为除了在R语言里面才看到数据的信息,不利于数据的预处理,以及表头的确认一种是纯文本文件。
纯文本文件的格式多为.txt .tsv .csv也有可能不带任何的后缀,文本文件类型和后缀不是强关联(所有的文件类型其实和文件后缀都无关,文件后缀只是辅助用户判断是个什么文件)(后缀改变不会改变数据的格式,就算把后缀扩展名删了也一样,这个还可以随意改,只要能用文本软件打开且没有乱码,就是文本文件)实际的数据分割符,要打开来查看,一般常见的分隔符就是制表符\t,csv常用的逗号分隔符, 空格分割符等
欢迎联系我。