关于置信区间,之前我有长篇文章探讨过。
我来科普下:什么是置信区间? 为什么置信区间非常重要?【修改版】
现在我来讲讲,如何计算置信区间?什么时候需要计算置信区间?
一、什么时候需要计算置信区间?
一篇论文主分析结果需要带有计算置信区间。
一篇文章总有研究目的,也不会有太多的研究目的。比如现况调查主要现况估计,队列研究主要探讨影响因素,随机对照研究要评价处理因素效应等等。
针对主要研究目的,都有一个最重要的分析结果,称为主分析结果。主分析结果是一篇文章下结论的最重要依据(意味着你主分析结果是阴性的,你的这个研究就是阴性结果)。
但是一篇文章除了针对主要研究目的主分析结果之外,还有其他各种统计学分析。不是所有的分析结果都要提供置信区间,也就是主分析结果提供即可。
比如,随机对照研究定量结局的分析,有基线比较,有干预前后比较,有干预后比较。详细案例可见本公众号的推文:
小统计大文章(上) | 14天学会医学统计与SPSS公益课(D8)
做了很多的比较,但是实际上,主分析是干预后的比较,或者干预后前后差值的比较,只有这个结果才有必要提供置信区间,而这个置信区间就是均差的置信区间。
所以这里又要说下,一般一篇论文最重要的主分析结果指标。
主分析结果很多,除了我们常见的P值之外,但常见的是现况调查了解总体的参数,另外一类评价研究因素的效应值。
(1)现况调查有总体率、总体均数,因此有总体率和总体均数的95CI%
(2)研究的效应值更多了:随机对照研究的均差、率差、中位数差、OR、RR、HR;观察性研究中的OR、RR、HR、均差等等。
二、如何计算置信区间?
1. 两组均数均差的置信区间。SPSS t检验直接会给出均差的置信区间。
2.两组偏态数据秩和检验也会给出置信区间。
作为偏态分布数据,本体两组差值的95%CIC采用可以Hodges-Lehmann方法。偏态分布的两组中位数差值95%CI置信区间,具体方法可见下面文章:
《新英格兰医学杂志》论文统计解读:如何计算中位数差值的置信区间
3. 配对t检验偶尔也会成为主分析方法,置信区间也是在开展配对t检验时候,SPSS软件同时给出。
4. 率差的置信区间估计
很多统计软件可以算率差置信区间,但是率差的算法SPSS25-26没有操作方法(版本27.0 及最新版本28.0有了),只有公式计算方法,你可以采用excel或者手工计算方法进行以计算:
假如P1 和P2 代表两组率,则率差为P2-P1,而率差的95%CI则为
其中,
比如,本例,P1=45.5%,Q1=54.5%,P2=80.8%,Q2=19.2%,n1=44,n2=26,把数据带入公式中,就可以计算了。
5.观察性研究中一般主分析方法都是回归分析,线性回归计算回归系数b秩的置信区间,logistic回归计算OR置信区间,Poisson回归RR置信区间,Cox回归计算HR置信区间。他们都是SPSS自带可以直接计算。
当然数据分析时,还有更多的统计学策略和主统计学方法,意味着有更多形式的置信区间的算法,这里不再一一列举了。如果你今后碰到,不妨好好思考下。