公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

预测模型为啥拆分了数据集又要10折交叉验证?

Administrator
发布于 2025-03-11 / 8 阅读
0
0

陈老师认为,是不需要的。

将数据集划分训练集和验证集是在简单拆分中才会应用,是临床预测模型较为简单的一种方法。

√交叉验证一般在样本量中等或较少的时候,会采用10折交叉验证。

  • 10折交叉验证的优势是每个数据点都会被用作训练集和验证集,最大限度地利用数据资源,多次验证的结果汇总提高了模型性能评估的稳定性。

但我们在用10折交叉验证的时候,每次建模并不是用到整个人群的数据,而是把数据拆成10份,

  • 其中9份用来建模,另外1份用来验证,然后重复做10次,再把验证的结果进行合并。

所以交叉验证中,模型构建会用到整个人群的数据,但训练集并不是整个人群。

这个统计问题就解答到这里,大家可以关注我们的公众号“医学论文与统计分析”,我们将分享更多统计学知识!


评论