
讲真的,当下医学生信,风口很明显了…
套路一:(基于转录组)某种疾病 + 某个基因集合分子标记
利用公共 TCGA 或转录组学数据,就某种感兴趣的疾病和某个基因集合通过机器学习、生存分析、PPI 网络和差异显著性分析筛选分子标记,再补充免疫浸润、药物预测、分组对接等内容。
示例:
- ✅ 《复发缓解型多发性硬化患者外周血中关键铁死亡相关基因的鉴定及其诊断价值》
- ✅ 《胃癌脂肪酸代谢基因相关亚型的鉴定和免疫景观分析》
- ✅ 《昼夜节律基因通过影响肿瘤免疫浸润和肿瘤细胞增殖促进胶质瘤的进展》
推荐文献:
- 文章标题:
Identification of cuproptosis-associated subtypes and signature genes for diagnosis and risk prediction of Ulcerative colitis based on machine learning 中文注释:
基于机器学习的溃疡性肠炎诊断和风险预测中铜死亡相关亚型和特征基因的鉴定 来源:Front Immunol, 2023 (Q1, 医学-2区, 免疫学-2区)。
DOI: 10.3389/fimmu.2023.1142215
套路总结:
- 选题
从感兴趣的疾病及基因集合入手。 - 数据处理
使用 DEG/WGCNA 与基因集基因取交集。 - 分析方法
通过机器学习、PPI 分析、生存分析、KEGG/GO 进一步缩小范围,得到几个 Marker。 - 后续分析
对 Marker 进行后续分析,比如药物预测、免疫相关性分析、细分亚型展开分析等。
套路二:单细胞多组学
单细胞组学联合其它组学(如转录组学、代谢组学等)的文章数不断上涨,主要分为两种:
- 其它组学为主,单细胞为辅
如通过转录组学发现某疾病的 Marker,然后通过单细胞组学观察相关 Marker 基因在各个细胞的表达情况。 - 单细胞为主,其它组学为辅
用于单细胞常见分析方法,例如聚类分类、细胞注释、轨迹分析和差异分析等,找到关键 Marker,然后通过多种组学手段验证。
文献推荐:
文章标题:
Integrated bulk and single-cell transcriptomes reveal pyroptotic signature in prognosis and therapeutic options of hepatocellular carcinoma by combining deep learning
中文注释:
整合 Bulk 和单细胞转录组通过结合深度学习揭示肝细胞癌的预后和治疗选择中的焦亡特征
来源:Brief Bioinform, 2023 (Q1, 生物学-2区, 数学与计算生物学-1区)。
DOI: 10.1093/bib/bbad487
套路总结:
- 单细胞组学分析:
通过单细胞组学分析得到 Marker 基因。 - 转录组学数据整合:
用转录组学数据得到的 Markers 取交集。 - 模型构建:
构建了预测风险的 PR 模型,将样本分为高低风险组。 - 差异分析:
通过各种分析方法和技巧的堆叠比较两个组别的差异。
套路三:XXX + 网络药理学
网络药理学是近年来研究热点,2020 年前,单纯网络药理学大火,涌现了上万篇相关文献。2021 年起,网络药理学的文章发表量急速下降。要从网络药理学入手发文,往往需要结合其它方法。
常见组合:
- 与 META 分析或孟德尔随机化方法结合:
研究某某药物对某种疾病具有治疗作用。 - 网络药理学机制研究:
探索潜在的分子机制。 - 多组学结合:
找到疾病靶点,再结合网络药理学探求分子机制。
示例:
- 结合网络药理学研究特定疾病的治疗机制
- 结合网络药理学与生物信息学分析特定药物的作用机制
文献推荐:
文章标题:
Exploring the potential mechanisms of Yi-Yi-Fu-Zi-Bai-Jiang-San therapy on the immune-inflamed phenotype of colorectal cancer via combined network pharmacology and bioinformatics analyses
中文注释:
结合网络药理学和生物信息学分析探讨薏苡附子败酱散治疗结直肠癌免疫炎症表型的潜在机制
来源:Comput Biol Med, 2023 (Q1, 医学-2区 工程: 生物医学-2区)。
DOI: 10.1016/j.compbiomed.2023.107432.
套路总结:
一般的网络药理学是通过数据库将 XX疾病基因 与 YY药物 取交集,然后经过 GO/KEGG 富集分析、PPI 网络分析之后,外加分子对接,再预测 YY 药物通过 ZZ 靶点的 OO 通路治疗 XX 疾病。
在上述文献案例中,XX疾病的基因是通过各组学分析手段获得的。
- 分析方法:
作者通过转录矩阵,按照免疫浸润情况对样本聚类,再通过比较类群的差异基因得到 XX 疾病的相关基因。这不仅提升了疾病基因集的可信度和合理性,还丰富了文章内容。此外,作者还进行了生存分析和单细胞分析,进一步阐述了目标靶点 ZZ 在 XX 疾病的预后相关性以及解释了 YY 药物的治疗机制。 - 研究前景:
目前通过网络药理学方法挖掘中药在各种疾病的治疗机制还有很大的发表空间。结合各类组学分析手段 + 网络药理学分析,也能发表 3~8 分左右的文章。
套路四:影像组学 + 机器学习
- 基础做法:
利用机器学习及影像组学技术构建疾病的诊断模型。 - 高级做法:
结合生信其它手段进一步分析。
例如,通过影像组学提取特征,结合基因组、转录组数据进行多模态分析,以增强疾病诊断的准确性和治疗方案的优化。
推荐文献:
文章标题:
Distinguishing common renal cell carcinomas from benign renal tumors based on machine learning: comparing various CT imaging phases, slices, tumor sizes, and ROI segmentation strategies
中文注释:
基于机器学习区分常见肾细胞癌和良性肾肿瘤:比较不同的CT成像时相、切片、肿瘤大小和ROI分割策略
来源:Eur Radiol, 2023 (Q1, 医学-2区, 核医学-2区)。
DOI: 10.1007/s00330-022-09384-0
套路总结:
文章思路比较简单,是经典的机器学习模型发文思路。此类文章的难点是数据的获取、图像处理方法的选择和 ML 模型的使用。在深度学习发展的今天,也可以用深度学习来处理图形数据。
总结:
以上是今天分享的4个生信经典套路,你学会了吗?