现在对医学研究缺失数据填补的问题,很多人都有了一定的思考,有缺失,还是要填补,无论是临床试验、调查研究,无论是前瞻性还是回顾性。 但我们都知道缺失数据填补不能随便填,一个变量,过高比例的缺失,填回去也没有价值。
流行病学调查中,许多指标比如量表总得分、个体生理、生化指标等呈现偏态分布。面对这种情况,我们如何处理呢?一组数据,特别是正态性检验P值小于0.05的资料,能否使用t检验或者F检验一直有着争议。 这个话题真的很传统、又很重要、往往大家又搞不清。尤其是大样本偏态数据,能否做t检验?因为大样本资料基本上通
我们开展统计分析,包括线性回归、logistic回归、Cox回归时,习惯“先单后多”,也就是先开展单因素分析,再开展多因素分析。 一般情况下,单因素分析统计学意义(P值小于0.05)者,会被纳入进来开展多因素回归。 但是,先单后多,最令人沮丧的,莫过于单因素P<0.05,而多因素大多数没有统计学意义
现在流行的做法就是倾向得分匹配(PSM)。 但是,倾向得分匹配也会碰到问题,其中主要的问题是,两组数据差别太大,相似的个体很难凑,凑不上匹配数据。 这样子会删除一大堆匹配不
网络上、甚至一些统计学教材中认为,大样本资料可以无视正态性问题。他们认为 “根据中心极限定理,无论样本来自何种分布,只要样本量足够大(一般认为样本量大于50或者100以上)
我们先了解一下非随机对照研究的概念。 √非随机对照试验(Non-randomized Controlled Trial, n-RCT),是指未按随机化原则将研究对象分组,患者可以自主选择选择干预组药物还是对照组药物。 在这种情
√什么是轨迹模型? 简单来说,轨迹模型分组无非将多次测量的变量或多个变量进行聚类,将其整理成一个变量,比如多次测量的暴露因素聚类成一个暴露因素。 那么这个暴露因素可以分为:持续上升,先上升后下降,持续下降这么几组。
√回归分析对因变量有什么要求吗? 有的,要求正态分布。 但是这个正态分布不是说因变量Y是正态分布,是残差正态分布或者近似正态分布。
在诊断预测模型中,我们常用的还是回顾性的数据,更加容易实施,获取数据也方便。 如果用前瞻性的队列设计,当然也可以得到高质量的数据,有助于模型的准确性和可靠性。 而随访时间的长短受疾病、人群、样本量的影响。