陈老师认为,是不需要的。
将数据集划分训练集和验证集是在简单拆分中才会应用,是临床预测模型较为简单的一种方法。
√交叉验证一般在样本量中等或较少的时候,会采用10折交叉验证。
10折交叉验证的优势是每个数据点都会被用作训练集和验证集,最大限度地利用数据资源,多次验证的结果汇总提高了模型性能评估的稳定性。
但我们在用10折交叉验证的时候,每次建模并不是用到整个人群的数据,而是把数据拆成10份,
其中9份用来建模,另外1份用来验证,然后重复做10次,再把验证的结果进行合并。
所以交叉验证中,模型构建会用到整个人群的数据,但训练集并不是整个人群。
这个统计问题就解答到这里,大家可以关注我们的公众号“医学论文与统计分析”,我们将分享更多统计学知识!