我们在开展临床试验的时候,患者随机分为两组,开展分析。由于是随机化分组,实验组和对照组在人口学、基础指标、病情等方面应该是均衡可比的
统计学也往往采用t检验、卡方检验等方法来比较实验组和对照组的差异性,若P值小于0.05,则说明两组存在着统计学差异,当然,一般情况下P值都是大于0.05的,也就是没有统计学差异。我们一般视为均衡可比。
问题来了,临床试验基线两组比较有若干个指标P值≤0.05,是有统计学差异,那么两组不均衡了吗?
统计学差异是一个数字游戏,并不能直接推导出均衡性的问题。均衡性是实验设计的术语。
两组数据是否具有统计学差异,不仅与两组数据的本质差异有关,而且非常重要的是,和样本量有关(抽样误差有关)。
样本量越大,抽样研究抽样误差越小,采用统计学分析时P值越小。
因此,如果样本量很大,即便两组实际差异非常非常小,P值也会小于0.05,反之,样本量很小,P值就大了。
P值小于0.05,的确有差异呀,为什么还可以说均衡呢?
各位可以思考下,“均衡”有没有标准?当然没有,那么什么才是均衡呢?P值决定?岂不知,P值小于0.05就有统计学差异本身也不是一个标准,只是约定成俗的东西。
实验设计学是怎么认定均衡的呢?只要是随机化分组研究,两组就是均衡的,哪怕是简单随机分组。
这句话和P值矛盾。很多样本量较大的随机对照研究,基线比较有统计学差异的,但是我们仍然认为它是均衡可比的。因为它是随机分组的。
不用质疑这句话。
因此,很多高水平随机对照研究论文,基线是不比较的。特别是顶级论文。基线比较是画蛇添。因为它是随机对照研究,那就基线可比!因为此时差异性比较的P值意义不大,反而添堵。
反过来说,如果不是随机化研究,比如观察性研究,队列研究呀,病例对照研究,根据实际情况自动成组的,那么两组就是不均衡的,哪怕基线是可比的!
所以观察性研究,哪怕所谓的均衡,也可能存在未知混杂因素,结果还是不那么靠谱。
总结来说:真随机分组,均衡;假随机、不随机,不均衡。
我是郑老师,在这里讲讲统计学的点滴细节。有问题,请留言。