公众号
医学论文与统计分析公众号
扫码关注公众号

统计咨询
添加助教微信即可咨询
添加助教微信即可咨询

意见反馈
邮箱:17357190071@163.com
微信:aq566665

是时候为非参数检验平反了,它不是备胎!

Administrator
发布于 2025-03-26 / 110 阅读
0
0

统计小食系列(11)

今天我要说的故事,主角是我们的统计方法--非参数检验。因为最近很多朋友问“郑老师,数据偏态能用t检验吗?”,“你看我这数据能进行方差分析吗”。t检验和方差分析是统计分析最喜欢用的,因为它们被称之为参数检验。

我说,你不妨试试非参数检验,但是他们会说“什么是非参数检验”。可怜的非参数检验。

什么是参数和非参数检验?

参数检验是基于特定数据分布,比如正态分布,对其总体参数进行假设检验的方法;

非参数检验对数据的分布没有要求,无论何种数据分布,无论正态偏态,无论定量定性;一般不探讨总体参数,而用于探讨总体分布轮廓或者位置的一种方法。

非参数检验,它就是一个备胎。凡是教材都如此说,凡是教统计学的老师如此说,郑老师我也这么说!否则学生会觉得迷茫,困惑,他们会觉得,郑老师和教材讲的不一样。

总结来说,如果小样本数据是正态分布或者大样本采用参数检验,比如t检验,F检验,如果是小样本严重偏态分布的采用非参数检验。

在这里,我要说下关于非参数检验的几个误区,并建议大家如何使用非参数检验。

非参数检验的误区

1. 非参数检验常见方法包括哪些方法?

一般来说,医学统计学会介绍一类非参数检验方法,那就是秩和检验,秩和检验又分为三种具体方法,一种是wilcoxon符合秩和检验,用于配对样本的假设检验,一种wilcoxon两独立样本秩和检验,还有一种是Kruskal Wallis 多样本秩和检验。

还有吗? 其实,非参数检验方法还是很多的!

第一种,更加耳熟能详的方法:卡方检验!没有错!用于分类数据比较的卡方检验就是非参数检验的一种。它不探讨总体参数,而是对总体分布轮廓开展的假设检验!

第二种,McNemar检验。这种方法俗称配对卡方检验,用于比较配对设计的二分类数据总体分布有无差异性。

第三种,秩相关分析方法。它是相关分析的方法。相关分析方法常见的是线性相关,但是线性相关要求双变量是正态分布。如果是非正态分布的话,就不好用了,因此一般用秩相关分析,又称为Spearman相关。类似的方法还有Kendall秩相关分析方法,用于等级变量和等级变量的相关性

第四种,CMH方法。简单来说,我们可以称之为分层卡方分析,用来干嘛呢?用于进行分层分析,进行定性结局亚组分析、控制混杂偏倚的一种非常重要的统计学方法。

第五种方法,LogRank检验。这种方法在生存分析非常之主流,用于探讨生存时间分布有无统计学差异。

还有更多,比如诺贝尔经济学家发明的friedman配对等级变量的等等。

总结来说,非参数检验方法比参数检验方法更多。它主流吗?非常之主流!远比我们想象地主流!

2. 非参数检验的检验效果如何?

一般来说,如果完全正态分布情况下,以两组定量数据比较为例,非参数检验的检验效能一般是t检验的95%。

什么意思呢?也就说如果正态分布数据100个t检验做出了具有统计学差异(P<0.05),如果做只秩和检验,大概有95次能做出统计学差异的效果(P<0.05)。这效果怎么样?我感觉非参数已经非常棒了!

而实际上,我们现实中的数据,完全正态分布有多少?几乎不太可能!总是带有一点偏态,而且更大的麻烦是,往往存在着异常大或异常小的极端值。很显然,这个时候,参数探讨总体均数有无差异,是不合适的?为什么?因为这个时候样本均数没有代表性!

我认为,现实场景下,绝大多数的数据,非参数检验效果优于参数检验。

3. 国际上非参数检验方法用得多不多?

2005年,NEJM发表了一篇文章《Statistical Methods in the Journal》[1],可以看到1978-1979,1989以及2004-2005年期间,NEJM发表的原始研究使用的统计方法总结。2017年,NEJM对此进行了更新,统计了2015年发表的论文所用的统计学方法。

我们可以从一下的折线图看出40年来统计方法使用的频率! 红框标志的是非参数检验方法!你会发现,非参数检验比参数检验显然用得更加广泛!

非参数检验方法使用频率快速增加,而参数检验,特别是t检验下降明显。

t检验在1978-1979期间是最为常用的统计学方法(44%),但是其使用频率有下降的趋势,1989、2004-2005、2015年的文章中,分别有39%,26%和31%使用了t检验。

如何使用非参数检验

一句话:鼓励使用非参数检验。

具体而言,

1.遇到正态分布数据的时候,建议使用均数(标准差)描述数据,用t或者F检验来开展分析。可以用非参数检验吗?没有任何问题!

2.遇到近似正态分布,参数法或者非参数法(主要是国内外的人都喜欢均数来描述数据)都可以。

3.遇到异常值、极端值或者严重偏态分布,必须使用中位数(四分位数间距)来描述,必须使用非参数检验!被担心本方法不主流!


评论

收银台

订单信息

应付金额 积分

模块介绍

请加我们助教二维码或加入Zstats使用群
Zstats交流群

Zstats交流群

助教二维码

联系助教

选择支付方式

请输入助教告诉您的积分券

如果不填写积分券,将直接使用当前余额支付

正在创建订单...

请稍候,正在为您生成支付订单

支付二维码

请使用扫描二维码完成支付

等待支付中...

二维码获取失败

支付二维码获取失败,请点击重新获取

正在处理余额支付...

请稍候,正在为您完成支付

正在处理充值并支付...

正在使用积分券兑换,然后完成支付 正在使用当前余额完成支付

支付成功!

您的订单已支付完成,页面将在 秒后自动关闭

支付失败

支付过程中出现错误,请重新选择支付方式

平台说明