
瞬间对临床预测模型的兴趣达到10000000%
只能劝各位医学生到这步了…
想学临床预测模型一定不要错过《临床预测模型研究方法与步骤》
临床预测模型简介
临床预测模型,又称临床预测规则、预测模型或者风险评分,是指利用多因素模型估算患者有某病的概率或者将来某结局发生的概率。
具体点就是以疾病的多病因为基础,建立统计模型,用来预测具有某些特征的人群未来某种结局事件发生的概率。之后,预测模型逐步扩展到疾病的预后和诊断中。
近年来,临床预测模型越来越成为医学生发表SCI的香饽饽!今天小光给大家介绍一篇入门临床预测模型必看的方法论文章。👇
临床预测模型研究方法与步骤
莫杭洪¹,陈亚平²,韩博³,章亚平⁴,刘雨朦⁴,⁵,张姝¹,鲁小丹¹,华丽婷¹,诸宛佳³,蔡婉婉¹,夏云舒¹,沈楚迪¹
- 浙江大学医学院附属第二医院(浙江杭州 310000)
- 浙江大学医学院附属邵逸夫医院(浙江杭州 310000)
- 浙江大学医学院(浙江杭州 310000)
- 浙江大学医学院附属第一医院(浙江杭州 310000)
- 浙江大学医学院附属儿童医院(浙江杭州 310000)
- 浙江省中西医结合慢性疾病精准防控技术重点实验室(浙江湖州 313000)
本文结合预测模型研究的国内外进展,从数据收集、模型构建、性能评估、模型验证、模型呈现和模型更新 6 个方面介绍临床预测模型的开发过程以及临床预测模型研究的报告规范和偏倚风险评估工具,以期为国内研究者提供方法学参考。
临床预测模型开发研究基本步骤
临床预测模型开发的过程包括数据收集、模型构建、性能评估、模型验证、模型呈现和更新等环节。
1 数据收集
数据来源
数据来源 | 优缺点 |
---|---|
横断面研究 | 简单和快速获取预测特征和诊断测试值,但数据来源可能收集不完整,结局评估不完整和/或信息偏倚等 |
前瞻性队列研究 | 在进行结局目标标准测量和预测因子测量方面具有优势,但往往代表性问题和选择偏倚 |
回顾性队列研究 | 便捷和经济,样本量较大,预测因子和结局定义、测量时间点的标准化以及较大的样本量 |
患者登记研究 | 样本量大,代表性好,适合慢性疾病的预测模型研究 |
其他资料如大数据 | 电子病历、影像资料等 |
潜在预测因子选择
预测因子主要包括:
- 人口统计学特征(如年龄、性别、种族、教育、社会经济地位)
- 疾病类型和严重程度(如主要诊断、表现特征)
- 病史特征(如既往疾病发作、风险因素)、共病(伴随疾病)
- 病理学特征、医学影像、遗传特征、身体功能状态(如 Karnofsky 评分、世界卫生组织表现评分)
- 主观健康状况和生活质量(心理、认知、心理社会功能)等。
对予后模型,避免纳入与结局直接相关或直接确定的强相关预测因子,在患者明确已有其中一个阳性变量下,其已是预后结局明确的高危患者。相反,研究者应关注与结局存在不确定性的预测因子,探究预测因子对结局事件的影响。
确定解决指标
预测结局 | 特点 |
---|---|
致死事件 | 以死亡为结局的局事件,有时被写新发原因定义,且发生率较低,包括所有原因的死亡及特定原因死亡 |
非致死事件 | 相对较“软”的终点,与临床决策相关,样本量需求增加,如肿瘤复发、心血管事件等 |
以人为中心 | 强调患者自我感受,如疼痛程度、功能恢复、生活质量等 |
复合终点 | 关注连续的结局事件,尤其是经济角度,最典型为疾病所致缺勤工作 |
样本量估算
数据清洗
类型 | 描述 |
---|---|
完全随机缺失(MCAR) | 数据缺失发生完全随机,与任何变量无关 |
随机缺失(MAR) | 数据缺失发生非完全随机,与其他变量存在一定关系 |
非随机缺失(MNAR) | 缺失值与其自身或未观测变量相关,不能通过其他变量推断 |
2 模型构建
筛选预测变量
运算法则 | 说明 | 优点 | 缺点 |
---|---|---|---|
向后法(BE) | 从整体模型开始,逐步剔除不显著的自变量 | 便于筛选重要变量,简单快捷 | 可能过度拟合,依赖初始模型 |
向前法(FS) | 从最显著的单变量开始逐步引入变量 | 可快速建立模型 | 可能遗漏重要变量 |
逐步向前法 | 每一步都添加变量,模型逐步逼近最优 | 灵活平衡,适中策略 | 同上,依赖初始模型 |
增强后向/前向逐步法 | 在基本逐步法基础上结合前向/后向法优点 | 可考虑变量交互作用 | 模型不稳定 |
增强信息准则筛选法 | 使用AIC/BIC等指标筛选变量组合 | 综合评估拟合优度与复杂度 | 计算开销大 |
主成分法 | 降维提取主要信息 | 避免多重共线性问题 | 解释性差 |
LASSO回归 | 变量选择与模型拟合同步进行 | 自动化程度高 | 对变量缩减程度敏感 |
模型拟合
使用筛选后的预测变量和其他需要考虑的变量,通过多因素模型来估计它们与感兴趣结局变量之间的关系,该过程为模型拟合,又称模型构建。
不同的结局变量,适用的模型也不同,详见下表:
结局类型 | 常见建模方法 |
---|---|
二分类结局 | Logistic回归、支持向量机、KNN等 |
多分类结局 | 多项Logistic回归 |
生存结局 | Cox回归、Kaplan-Meier分析 |
连续变量 | 线性回归等 |
3 模型性能评估
临床预测模型的性能评估包括整体性能、区分度、校准、重分类和临床有用性五个方面。
开发后模型时,可能面临多个时间节点的生存情况,则需对模型的性能进行多次评估。
4 模型验证
模型验证是评估预测模型性能和泛化能力的重要步骤,
包括内部验证和外部验证:
内部验证
- 在同一数据集上训练和评估模型;
- 检查是否过度拟合或欠拟合。
验证方法 | 描述 |
---|---|
简单数据划分 | 将数据分为训练集和测试集 |
交叉验证 | 如k折交叉,重复训练评估,稳定性好 |
Bootstrap | 多次有放回抽样训练模型 |
外部验证
- 在独立数据集上评估;
- 验证模型外推能力。
外部验证方式 | 描述 | 优点 | 缺点 |
---|---|---|---|
时间验证 | 不同时间点的数据 | 能验证模型稳定性 | 数据更新快时需重新建模 |
地理验证 | 不同地区数据 | 可评估地区泛化能力 | 数据来源差异影响大 |
领域验证 | 不同医院、研究中心 | 可推广性强 | 方法标准差异大 |
完全独立 | 完全不同机构和研究 | 最具挑战,最高外部效度 | 数据难获取,结果差异大 |
5 模型呈现
临床预测模型的基本形式一般为数学统计模型,为了提升模型的临床适用性和可操作性,往往需对模型进行可视化呈现。
常见的呈现形式包括:
- 回归公式
- 简化表格评分系统
- 图形化评分
- 列线图
- 移动网站和程序
简化评分系统和图形化评分便于临床理解,但可能误差大。
列线图直观清晰,适用于综合评估,但依赖特定模型公式。
移动网站和程序提升便捷性,但设备需配合。
最适合的呈现形式需结合环境与目标人群灵活选择。
6 模型更新
理想的预测模型能在不同时间和地点为患者提供准确的预测结果。当使用的环境和开发模型的样本类似或无新相关指标出现时,可以通过观察结果和模型预测比较来评估模型的效度。
更新模型时,研究者可以:
- 更新风险基线
- 对模型进行重新校准、重评估、扩展、修订、系统收缩等
需注意的是风险生存模型需要更新预测指标以及按时间点重标定。
更新模型的主要方法可以归结为:
- 回归系数更新
- Meta-model 法
- 动态模型构建
7 预测模型研究报告规范
预测模型研究报告遵循个体预后与诊断模型研究报告规范
TRIPOD(transparent reporting of a multivariable prediction model for individual prognosis or diagnosis),
适用于模型开发、验证和更新研究,也用于评估研究报告时作为参考。
8 临床预测模型研究质量评价
与其他研究一样,开发临床预测模型也会产生偏倚风险。
可使用 PROBAST(prediction model risk of bias assessment tool) 工具
用于评估预测模型开发研究中:
- 偏倚风险
- 其适用性
- 对模型的选择、改进和应用提供支持。