公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

所有的P≤0.05为何结论却是阴性结果?来看看这篇文章吧

Administrator
发布于 2025-07-21 / 1 阅读
0
0

今天题目可能有点标题党,但事实上可能大多数人一下子想不到,为什么P≤0.05,结论却是阴性的呢。

下面,我们简单看看这篇JAMA主刊的文章,帮助大家理解!

2024年12月2日,医学顶刊《JAMA》(医学一区top,IF=63.1)发表了一篇题为:“Personalized Patient Data and Behavioral Nudges to Improve Adherence to Chronic Cardiovascular Medications:A Randomized Pragmatic Trial”的研究论文,旨在比较三种不同类型的短信策略与常规护理,以提高不依从心血管药物治疗的患者的药物补充依从性。

(如果你需要全文,请在医学论文与统计分析公众号后台回复关键词“pdf”。更多关于临床试验设计与数据分析服务,请联系郑老师团队,助教微信:aq566665)

研究设计

P(Population)研究对象:年龄在18~90岁之间,9501例确诊1种或多种心血管疾病并给予药物治疗的患者。【心血管疾病定义为:高血压、高脂血症、糖尿病、冠状动脉疾病[CAD]或房颤。】

I(Intervention)试验组:

(1) 通用提醒短信(补充药物的短信提醒)

(2) 行为轻推短信(通过文本内容促进用户立即补充药物)

(3) 行为轻推短信+固定消息聊天机器人(在行为轻推的短信基础上加一个聊天机器人,该机器人使用预编程算法与患者互动)

C(Comparison)对照组:常规护理(患者不接收短信)

O(Outcome)结局:

主要结局:药物补充依从性,即在12个月内药物覆盖的天数比例(PDC)。

该数值基于药店数据计算,所有类别的药物在基线时就已确定补充间隙。

次要结局:急诊科就诊、住院和死亡的临床事件。

S(Study design)研究类型:实效性随机对照试验

本研究是一篇实效性随机对照试验,关于实效性随机对照试验的定义,可以看一下郑老师之前的推文:实效性临床试验介绍

这项试验在三个不同的美国医疗保健系统中进行,涵盖了多样化的患者群体,包括传统上在临床试验中代表性不足的患者(如约49%的西班牙裔患者)。

这种设计使得试验结果更有可能代表真实世界中的患者群体,也是本研究实效性的体现。

图1 研究流程

个性化提醒并未增加患者的药物依从性

研究结果表明,在12个月时,各组的药物平均PDC:

  • 通用短信提醒组为62.0%;

  • 行为轻推短信为62.3%;

  • 行为轻推+聊天机器人为63.0%;

  • 常规护理为60.6%。

图2 每月覆盖天数比例

结果发现,与常规护理相比:

  • 通用提醒组的平均PDC高出2.2个百分点(P=0.02)

  • 行为轻推组高出2.0个百分点(P=0.04),

  • 行为轻推+聊天机器人组高出2.3个百分点(P=0.02)

可以看到,P值均小于0.05,但是最后作者仍然下了阴性的结论, 短信提醒在12个月时并未提高药物补充依从性。

这是为何呢?

图3 矫正调整后,与常规护理相比,干预组的覆盖天数差异

统计学解读

这个道理也很简单,高质量临床试验,多组比较需要控制假阳性率的情况,也就是一类错误,如果多次比较不调整检验水准α,仍然P≤0.05,便具有统计学意义,那容易得到不真实的有阳性结果。

研究者采用了多阶段gatekeeper方法通过调整检验水准α的方式来控制假阳性。

  • 第一阶段:将3个治疗组与常规护理组进行比较,使用校正阈值0.05/3进行多重治疗比较,P<0.017为有统计学意义;

  • 第二阶段:如果有任何一个检验有显著性,则对3个两两比较采用显著性水平(R/3)×(0.05/3)的Holm方法,其中R为第一阶段检验的显著性数量。

在调整分析中,第一阶段分析后,使用调整后的显著性水平0.05/3进行比较时并不显著,因此没有进行第二阶段干预组之间的成对比较。

所以所有结果都是有阴性结果!!!!

临床试验中多组比较十分常见,因此,在不同的临床研究中需要采用不同的策略与方法将总体Ⅰ类错误率控制在预设的水平,进行多重性调整控制假阳性。

√也就是说多组比较假阳性问题不得不考虑!

那如何控制?常用方法有这几个:

(1)平行策略多重性调整方法——Bonferroni方法

(2)序贯策略多重性调整方法——Holm 递减方法

(3)序贯策略多重性调整方法——Hochberg递增方法

(4)序贯策略多重性调整方法——固定顺序的检验方法

(5)序贯策略多重性调整方法——回退法

方法介绍我就不过多赘述了,老郑之前开展过一期公益直播,可参见本公众号同名视频号中【第9期 临床试验假阳性问题的统计学考虑】。

也可参考这篇推文:中医药研究文章再发国际顶刊!我今天来聊聊多组两两比较的统计学方法

√是不是所有多重比较都要控制假阳性呢?

老郑告诉你,医学研究中,不是所有多重比较都要控制假阳性!

医学研究,有随机对照研究,也有观察性研究,多组比较实际上大多数都不用控制,尤其是观察性研究,因为观察性研究绝大多数是探索性的研究。

只有验证性的随机对照研究才需要,比如3期临床试验。其他的探索性研究,很多临床大夫发起的临床试验,都可以不用控制。验证性医学研究次要结局指标也可以不需要。

好了,今天就分享到这里,希望大家有所收获!


评论