公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

临床预测模型外部验证集按医院还是时间划分数据?

Administrator
发布于 2025-03-11 / 11 阅读
0
0

在临床预测模型分析中,会有模型的构建及验证,而验证一般又分为内部验证和外部验证。

  • 内部验证是指在模型构建的数据集中,通过统计方法(如交叉验证、自助抽样或留出验证集)来评估模型的性能;

  • 外部验证是指将模型应用到独立的外部数据集上,以评估其在真实世界中的表现。

两者都是为了评价的性能,但他们的场景是不同。

内部验证是随着模型构建之后,做完模型构建,如果不做内部验证,那么这个模型构建是不完整的。

从数据集来看的话

  • 内部验证的数据集要与模型构建的数据集是一样的,所以数据并不是按照病历来源不同或时间不同划分的,是一个数据集随机拆成两份,一份拿来验证;

  • 而外部验证的数据集则是与模型构建数据集是不同的,这个不同可以是不同地域,不同领域,不同时间都是可以,根据您的研究目的,都可以应用。

如在甲医院建模,在乙医院评价模型效果;在2000年数据建模,在2020年再收集数据评价模型效果;本来是评价胃癌人群的预后,在肠癌人群中评价预后,这些都是外部验证。

所以外部验证并没有说哪种划分更好,主要看模型评价的研究目的。

说到临床预测模型,给大家推荐一个好用的工具,就是郑老师团队开发的免费统计分析平台Zstats风暴统计,轻松实现logistic回归,cox回归预测模型构建,以及内外部验证,有需要的朋友可以试试!

https://www.medsta.cn/software

复制到电脑浏览器端,欢迎大家使用!

这个统计问题就解答到这里,大家可以关注我们的公众号“医学论文与统计分析”,我们将分享更多统计学知识!



评论