公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

SCI审稿人:因变量Y是偏态分布,不能做线性回归!又是一个普遍搞不清的问题

Administrator
发布于 2025-03-14 / 22 阅读
0
0

√回归分析对因变量有什么要求吗? 

有的,要求正态分布

但是这个正态分布不是说因变量Y是正态分布,是残差正态分布或者近似正态分布。

√什么是残差?

残差是真实的Y值和回归模型预测出来的预测值之间的差值,即残差=实际值−预测值。

每个研究对象都有个残差,而所有个体的差值汇总一起,就有一个分布。

图1 残差图

回归分析就要求残差分布符合正态或者近似正态分布。

一般数据分析的时候,我们需要先计算出残差,再绘制残差的直方图或者Q-Q图来看它的分布形态。

图2 残差的Q-Q图

因此,很多时候因变量Y是偏态分布,这个是时候如果残差分布是正态的,也可以开展多因素线性回归。

下次审稿人如果问你这个问题,你只要说残差是正态分布的,就应该没有问题。

需要注意的是,残差正态分布一般针对线性回归模型,对logistic和Cox回归模型没有要求。

现在AI发展越来越快,我们也得学会使用,不能被时代落下。比如说关于统计学问题,除了看文献,还可以使用DeepSeek进一步解答,再结合郑老师的统计答疑,效率会高很多。

这个统计问题就解答到这里,大家可以关注我的公众号“医学论文与统计分析”,我们将分享更多统计学知识!



评论