公众号

“医学论文与统计分析”公众号

扫码关注公众号

统计咨询

“公共数据库与孟德尔随机化”公众号

扫码关注公众号

意见反馈

邮箱:17357190071@163.com

微信:aq566665

可预开发票，郑老师团队25年统计新课预告，发表文章后退款

预测模型为啥拆分了数据集又要10折交叉验证？

Administrator

发布于 2025-03-11 / 15 阅读

0

陈老师认为，是不需要的。

将数据集划分训练集和验证集是在简单拆分中才会应用，是临床预测模型较为简单的一种方法。

√交叉验证一般在样本量中等或较少的时候，会采用10折交叉验证。

10折交叉验证的优势是每个数据点都会被用作训练集和验证集，最大限度地利用数据资源，多次验证的结果汇总提高了模型性能评估的稳定性。

但我们在用10折交叉验证的时候，每次建模并不是用到整个人群的数据，而是把数据拆成10份，

其中9份用来建模，另外1份用来验证，然后重复做10次，再把验证的结果进行合并。

所以交叉验证中，模型构建会用到整个人群的数据，但训练集并不是整个人群。

这个统计问题就解答到这里，大家可以关注我们的公众号“医学论文与统计分析”，我们将分享更多统计学知识！

评论

目录

推荐课程

SEER被禁了咋整？看看这几个公共数据库吧，浙大学者用其发文EHJ（IF=37.6）

SEER被禁了咋整？看看这几个公共数据库吧，浙大学者用其发文EHJ（IF=37.6）

优秀！中山大学硕士一作发文JAMA子刊（IF=10.5）！

优秀！中山大学硕士一作发文JAMA子刊（IF=10.5）！

100年前，R.A.Fisher出版《研究工作者的统计方法》，“p<0.05有统计学意义”由此而来

100年前，R.A.Fisher出版《研究工作者的统计方法》，“p<0.05有统计学意义”由此而来

“第一篇SCI论文”保发表训练营正式启动，发表不成功就退款

“第一篇SCI论文”保发表训练营正式启动，发表不成功就退款

一周69篇！中国学者发文量远超外国学者！| 孟德尔随机化周报（3.2-3.8）

一周69篇！中国学者发文量远超外国学者！| 孟德尔随机化周报（3.2-3.8）