MIMIC(Medical Information Mart for Intensive Care) 是由美国麻省理工学院(MIT)和贝斯以色列女执事医疗中心(BIDMC)联合开发的公开医疗数据库,专为医学研究设计。其核心数据来源于重症监护病房(ICU)患者的临床信息,经过严格匿名化处理,供全球科研人员免费使用(需通过伦理认证和申请流程)。 主要包括三类数据:临床数据(从ICU信息系统和医院档案中汇总);生理数据(从床边监护仪获得);死亡数据(社会保障局的死亡档案)。记录了患者的人口统计学信息、实验室检查、用药情况、生命体征、手术操作、疾病诊断、药物管理、随访生存状态等详细信息。 MIMIC数据库覆盖的疾病研究有哪些?MIMIC数据库能做哪些类型研究? ❓ MIMIC是什么? MIMIC(Medical Information Mart for Intensive Care)是由美国麻省理工学院(MIT)和贝斯以色列女执事医疗中心(BIDMC)联合开发的公开医疗数据库,专为医学研究设计。其核心数据来源于重症监护病房(ICU)患者的临床信息,经过严格匿名化处理,供全球科研人员免费使用(需通过伦理认证和申请流程)。 主要包括三类数据: 记录了患者的人口统计学信息、实验室检查、用药情况、生命体征、手术操作、疾病诊断、药物管理、随访生存状态等详细信息。 疾病的诊断主要通过ICD编码进行识别(包括ICD9和ICD10)。 📈 发文情况 目前总发文量达 1.7w+篇,光2024年就发文4000+,可以说是目前最热门的数据库之一了! 🦠…
今天给大家带来的内容非常干,一起来了解一下转录组学是什么?转录组学挖掘公共数据库的步骤;转录组学的推荐工具 ⭕转录组学(Transcriptomics):从基因表达角度出发,研究在不同时间、空间或生理条件下,细胞中所有RNA分子的表达情况,包括mRNA、lncRNA、miRNA、circRNA等。它能揭示基因的活跃程度、转录起始与剪接机制,并通过单细胞转录组、时序与空间转录组等技术深入揭示组织或器官中不同细胞类型的表达特征及其动态变化。 🧬 公共数据库转录组数据分析的常见流程 在数据获取与预处理阶段 首先从多个数据库下载相关数据,包括RNA-seq原始数据可通过NCBI SRA(使用prefetch或fasterq-dump)、ENA、TCGA(通过GDC或UCSC Xena)获取,处理后的表达矩阵则可从GEO(使用GEOquery R包)、GTEx、ArrayExpress等平台下载,同时提取样本的表型信息,如疾病状态和处理条件。 数据格式转换方面 使用fasterq-dump(SRA Toolkit)将SRA格式转换为FASTQ格式,对于微阵列数据,使用oligo R包处理Affymetrix平台的CEL文件。 质量控制和去污染步骤中 RNA-seq数据可使用FastQC进行质量评估,Trimmomatic或Cutadapt去除接头序列和低质量碱基,Bowtie2可用于比对宿主基因组后过滤宿主污染;微阵列数据则通过arrayQualityMetrics R包进行质控,过滤低信号探针。 数据标准化与批次效应校正方面 RNA-seq数据可使用DESeq2(基于负二项分布的标准化)、edgeR(TMM标准化)、Salmon/kallisto(TPM/FPKM计算),微阵列数据则使用limma R包(RMA算法、分位数标准化),批次效应校正可采用ComBat(基于线性模型)、Harmony、sva R包,并通过PCA图或UMAP降维图进行可视化验证。差异表达分析阶段,RNA-seq数据可使用DESeq2、edgeR、limma-voom进行分析,微阵列数据则使用limma(线性模型+经验贝叶斯校正),跨平台数据整合时需统一基因名(通过biomaRt)并进行表达值分位数对齐。 功能注释与通路分析方面 使用clusterProfiler(GO/KEGG)、GSEA(预排序基因列表)等工具进行基因集富集分析,数据库包括MSigDB、Reactome、WikiPathways;网络分析可使用WGCNA(加权基因共表达网络)、STRING、Cytoscape进行蛋白互作网络分析,驱动基因预测工具包括OncodriveCLUST(癌症数据)、VIPER(调控网络推断)。 结果验证与临床关联方面 采用从同一数据库下载独立队列数据进行验证(如GEO多数据集交叉验证),生存分析可使用survival R包、KM-plotter(癌症数据),多组学整合可结合DNA甲基化、拷贝数变异,使用MOFA、iCluster进行分析。…
医学生一起学起来,挑战7天完成一篇趋势性分析 Day 2!今日进展: 继昨天确定了目标期刊和文献后我对选定的主题进行了深入的评估,判断其可行性选题是任何一个研究中最重要的一步选对了就是事半功倍选错了就是一切努力都可能白费只要确定主题有研究价值我们就能信心满满地攻克所有方法学难题毕竟,“所有方法学都一定会被掌握”而且“框架写作法”会快射上手成稿 接着,我下载并精读了几篇基于GBD趋势性分析的高分经典文献发现结果展示部分大同小异主要区别在于研究的疾病不同写作风格和结构也有共通之处,那么,我该重点分析哪些具体内容呢? 通过阅读目标期刊的相关文献,我明确了需要完成的内容:–发病率和年均百分比变化(AAPCs)–患病率和AAPCs–DALYs率和AAPCs–全球发病率地图–新病例数量变化–发病率、患病率和DALYs率的趋势分析–发病率与社会人口指数(SDI)的关系 我们的挑战还在继续,让我们保持这股冲劲,一往无前!
CHARLS(中国健康与养老追踪调查),江湖人称“查尔斯”,是北京大学搞的国家级大型追踪调查,专门记录45+中老年人的健康、经济、家庭关系等数据,用以分析我国人口老龄化问题,推动老龄化问题的跨学科研究。 简单粗暴版解释:如果你是研究“老龄化”的,它就是你的“数据亲妈”;如果你是发愁没数据的医学生,它就是你的“论文再生父母”;如果你在科室卷不动临床数据,它就是你的“弯道超车神器”! 四大核心优点:全国覆盖:28个省、150个县区,数据比你的外卖选择还丰富! 超长待机:2011年启动,2-3年更新一次,追数据比追剧还爽! 多维透视:从血压血糖到存款保险,连“和子女吵架频率”都能研究! 免费白嫖:注册就能下载,科研人的眼泪(穷的)终于流干了! 不同科室对应疾病分类 内科系统 外科系统 其他重要科室 CHARLS数据库能做哪些类型的研究? 【基础款:新手友好型研究】 【进阶款:时间魔法系列】 【高端玩家区】 【技术流专区】 【脑洞大开区】
蛋白组学(Proteomics) 蛋白组学是研究细胞、组织或生物体内所有蛋白质的科学,特别是它们的结构、功能、相互作用和变化。 蛋白组学的核心是通过高通量技术,特别是质谱(Mass Spectrometry, MS)和其他生物技术,来分析和鉴定蛋白质。 它是基因组学的延伸,主要关注基因编码信息如何在蛋白质水平上体现,以及蛋白质如何与生物体的功能和健康状态相关。 蛋白组学实验的生物信息分析流程 1. 质谱数据预处理工具扩展与选择依据: 补充技术细节: 2. 数据库搜索工具对比: 参数优化关键点: 3. 定量分析标记与非标记定量对比: 类型 优点 缺点 TMT/iTRAQ 多重样本(11–16plex) 同位素干扰需校正(如TMT校正因子) Label-free 无标记成本,适合临床大样本 批次效应敏感,需严格标准化 4.…
今天的学员是肿瘤方向的,所以给大家分享一些肿瘤方向的Meta选题切入点,以下是一些小建议👇争议性选题筛选:通过PubMed检索“肿瘤类型 + therapy + controversy”筛选争议问题。技术可行性验证:联系医院或数据库确认影像、组学数据获取途径。跨学科合作:联合临床研究数据库、生信分析等。注册与发表:在PROSPERO注册选题 学员案例👇✔接收期刊:Frontiers in Oncology📉IF=3.5;中科院3区期刊📍发文方法:Meta分析 一、争议性疗法疗效比较 选题逻辑: 聚焦临床争议问题,如“免疫联合化疗 vs 单药 vs 化疗”的优劣。案例:《肺癌免疫治疗联合化疗的网状Meta分析》(Lung Cancer, 2019)研究设计: 纳入12项III期临床试验,覆盖未经治疗的晚期NSCLC患者。核心发现: 二、新兴诊断技术效能评估 选题逻辑: 验证人工智能、影像组学等技术在肿瘤诊断中的价值。期刊案例:《基于MRI的放射组学模型预测宫颈癌淋巴血管间隙浸润》(J Gynecol Oncol, 2024)研究设计: 纳入9项回顾性研究,共1406例宫颈癌患者。核心指标:…
医学生一起学起来,挑战7天完成一篇趋势性分析GBD!Day1. 公开数据库的挖掘太火热了其中GBD数据库的挖掘又十分的火爆那我就来挑战一篇GBD、一篇关于趋势性分析的GBDGBD数据库挖掘是目前的四大刊常客经常出现在顶级期刊上面这个数据库亮点就是:可视化统计学简单、而数据可视化才是关键自从上次挑战GBD数据库后我通过检索又发现新增了很多篇文献共同探索、共同进步,希望能增加几篇、也期待有所突破!这次我挑战的是全球疾病负担的趋势性分析(trend analysis)重点是分析DALYs、发病率、患病率这些指标的变化趋势分析过程中会用到Jointpoint软件首先确定目标期刊在检索文献的过程中,发现许多常见的疾病已有研究经过深思熟虑过后终于确定给了方向最终,我确定了一个相对来说不那么热门的疾病(也不限定领域了,哈哈) 我选择了BMC cancer作为我的目标期刊虽然他属于肿瘤学领域2区期刊但是之前BMC期刊的严谨性给我留下了深刻的印象目标文献选的是2024年最新发表的文献(DOI: 10.1186/s12885-024-12480-7)我们将使用最近2021年更新后的数据进行分析全力以赴,冲锋冲锋!
MIMIC数据库覆盖的疾病研究 MIMIC数据库是根据疾病编码寻找样本对象,理论上只要想做的疾病对象的样本量足够就可以做,主要包含以下科室和疾病: MIMIC数据库能做哪些类型研究
NHANES数据库是什么? NHANES(国家健康和营养检查调查)是由美国疾病控制与预防中心(CDC)主导的全国性健康监测项目,旨在通过问卷调查、体格检查和实验室检测综合评估美国居民的健康及营养状况。 该数据库自1960年代启动并持续更新,涵盖人口统计学、慢性病、膳食摄入、生物标志物等多维度数据,其公开性为研究人员分析疾病风险因素、制定公共卫生政策提供了重要依据,广泛应用于流行病学、营养学及医学研究领域。 发文情况 NHANES数据库可谓是顶流数据库。 目前总发文量达 1.7w+ 篇,光2024年就发文 4000+,可以说是目前最热门的数据库之一! NHANES数据库可做方向 ◆ 心内科: 心血管疾病(充血性心力衰竭、心肌梗死、心绞痛和冠心病)、心血管死亡率、高血压、心力衰竭、冠心病、心脏病死亡率、心脏代谢综合征。 ◆ 呼吸内科: 呼吸道症状(咳嗽、咳痰、喘息和劳力性呼吸困难)、慢性肺病(哮喘、支气管炎和肺气肿)、肺功能测量、COPD、潜伏性结核感染、哮喘、普通感冒、急性呼吸道感染。 ◆ 消化内科: 肝炎、慢性肠道疾病(慢性腹泻、慢性便秘)、炎症性肠病(IBD)、非酒精性脂肪性肝病或代谢功能障碍相关脂肪性肝病、肝纤维化、肝硬化。 ◆ 肾内科: 慢性肾病、肾结石、肾脏损伤/肾脏生物标志物、糖尿病肾病。 ◆ 内分泌: 糖尿病、代谢综合征、妊娠糖尿病、胰岛素抵抗相关指标、甲状腺激素、甲状腺功能障碍。…
今天给大家推荐一本期刊👇Respiratory Medicine ,致力于快速发表临床相关的呼吸医学研究。它结合了前沿的原始研究与处理呼吸系统疾病和治疗干预各个方面的最先进的评论。主题包括成人和儿科医学、流行病学、免疫学和细胞生物学、生理学、职业病以及过敏原和污染物的作用。 这本期刊没有文章类型偏好,根据很多投稿者的经验来看,病例报告很友好,Meta也会接收。并且最新的中科院分区也是稳定在三区的,大家可以尝试投递~ 今天,统计之光要分享的学员就投递的这本期刊✔接收期刊:Respiratory Medicine📉IF=3.5;中科院3区期刊