公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

都是控制混杂,倾向性得分匹配和多因素回归怎么选?

Administrator
发布于 2025-07-21 / 31 阅读
0
0

倾向性得分匹配和多因素回归都是事后控制潜在混杂因素的重要方法,相比而言,倾向性得分匹配方法更复杂。

  • 多因素回归分析方法在临床研究中最为常见,可以同时校正多种混杂因素/协变量的影响,从而得出更为客观的结论。所以,多因素回归的主要目标是在统计模型内部直接调整观测到的混杂因素对结果的影响,从而估计处理(暴露)的独立效应。它关注的是效应估计的精确度。

  • 倾向得分匹配方法(PSM)也是临床研究影响控制中应用较多的一种方法。在观察性临床研究和 RCT 研究亚组分析中,PSM的主要目标是构建一个可比的研究人群,使处理组(暴露组/干预组)和对照组在观测到的混杂因素上尽可能相似,并在整个研究设计阶段,得到类似随机对照研究的效果它关注的是组间可比性。

两种方法该如何选择

既然相较于多因素回归方法,倾向性得分匹配更为复杂,那我们可以直接用多因素回归吗?

并不是,我来说说我的看法,方法的选择主要取决于以下几点:

1.样本量大小

如果处理组样本量不大,多因素回归模型可能不够稳定(容易过拟合)。PSM 通过匹配可以更有效地利用有限的处理组样本,在匹配后的“总体”中进行比较。

当样本量足够大,能够支持包含必要协变量的回归模型,并且对模型形式的设定有较好的理论基础时,多因素回归是高效且直接的方法。

2.混杂因素的维度

当混杂变量非常多,而样本量相对有限时,构建一个包含所有交互项和非线性项的多因素回归模型可能不现实或不可靠。

PSM 的基本原理就是将多个混杂因素的影响通过一个综合的倾向性评分来表示,从而降低了协变量的纬度,减少自变量的个数,避免了高维回归的问题。

3.是否接受样本信息损失

多因素回归通常能更有效地利用所有样本信息。

PSM 在匹配过程中通常会丢弃大量不匹配的对照组样本(尤其是当处理组比例很小时),导致信息损失和统计功效降低。回归则保留了所有样本。

另外,PSM主要关注组间可比性,后续分析仍需要结合回归等方法来处理复杂结果。

不过,匹配后数据不建议用传统的两组差异性统计分析方法,或者传统的回归。

  • 当结局是二分类数据,倾向得分匹配后,应采用匹配logistic回归,或者说条件logistic分析。

  • 匹配后的生存分析,最推荐的应该是稳健法Cox回归方法,一些学者推荐了其它的方法,有一种是分层Cox回归,另外就是脆弱模型。

这些方法该如何实现

今天提到的所有方法,浙中大郑老师团队基于R语言开发的风暴统计平台均可以实现,并且配备了全套教程。

1.多因素回归方法

首先,混杂偏倚,特别是观察性研究的偏倚,我们常用的方式就是回归分析来处理。

而控制混杂的回归与探讨影响因素的回归,统计过程相似,但具体思路又有所不同。回归控制混杂中,我们有重点关注的焦点因素,不再像影响因素研究,对所有自变量"一视同仁"。

风暴统计平台早已更新了回归控制混杂功能,但2025版整合升级后,对回归控制混杂也进行了优化,分为了单模型法多模型法

并且分析结果以发表级三线表呈现,下载后直接放进文章中。教程在此,小白照做即可!

Zstats教程(6):线性回归控制混杂偏倚

Zstats教程(8):Logistic回归控制混杂偏倚

Zstats风暴统计教程(10):Cox回归控制混杂偏倚

2.倾向性得分匹配

郑老师团队风暴统计平台可以一键完成倾向性得分匹配分析,不用代码,0门槛操作,可以说比SPSS更容易上手,应该是全网独一份了。

搭配教程,更是无敌!

Zstats风暴统计教程(11):倾向性得分匹配方法

PSM分析必备的一表两图,直接下载发表级结果,省时省力。

3.倾向性得分匹配与回归结合

包括匹配后线性回归,匹配logistic回归,条件logistic分析,稳健法Cox回归方法,分层Cox回归以及脆弱模型,通通都已经部署在郑老师团队风暴统计平台,欢迎使用!


郑老师团队出品,必属精品!赶紧收藏网址,体验这把科研分析“利器”吧!

免费直达https://www.medsta.cn/software

最后,再次建议:如果你需要数据分析,多多用我本人开发的“风暴统计”在线统计平台,百度“风暴统计”就行。

大家也可以分享一下,让更多朋友可以在这里有所收获!

感谢网友的认可


评论