解读NEJM论文的一篇临床试验缺失数据处理方法。 ”数据缺失是困扰临床研究的心头大患,急得研究者抓耳挠腮。数据缺失如此多娇,引无数计算机学者、数学家、医学家竞折腰。今天我们就来看看一篇发表在顶级大刊NEJM上的结局多重插补文章。 2023年12月28日,一篇题为"Restrictive or liberal transfusion strategy in myocardial infarction and anemia"的临床RCT研究论文发表于《The New England journal of medicine》(一区top,IF=158.5),作者为美国罗格斯大学Jeffrey L Carson团队。这项研究纳入3504名有心肌梗死伴贫血的患者,将他们分入限制性和开放性输血策略组,通过对数二项回归模型和多重插补的方法,探究不同输血策略与心肌梗死复发或死亡的关系。结果表明,对于心肌梗死和贫血患者,宽松的输血策略并不能显著降低30天内复发性心肌梗死或死亡的风险。然而,限制性输血策略的潜在危害不能被排除。
这是一个技术难题,不少人在问,因为多重填补后很难直接开展自变量筛选进行处理。 所以作为一名知名“变态”导师的我,给研究生出了一道题目,当缺失数据采用多重填补后,怎么进行逐步回归法筛选自变量呢? 各位用自己的数据真实世界研究或者构建预测模型时,或多或少都会遇到存在缺失值
在该项研究中,研究团队使用了去身份化电子健康记录(EHR)数据,纳入老年患者。 本研究旨在基于8种机器学习法和SHAP法,构建可解释机器学习预测模型,以评估风险因素并预测老年心合并高血压患者的住院死亡率。 √缺失数据的处理 研究中所有变量的缺失数据比例均保持在30%以下,使用K-最近邻(KNN)分类算法对缺失数据进行处理。 √变量筛选 使用LASSO法在44个变量中筛选出9个最佳预测因子,包括年龄、住院时间(LOS)、中性粒细胞(Neu)、尿素、Cl、活化部分凝血活酶时间(APTT)、白细胞(LEU)、白蛋白和HDL胆固醇。
数据集中的缺失值对数据分析带来了重大挑战,特别是在数据准确性对患者诊断和治疗至关重要的医疗领域。尽管MissForest(MF)在填补研究中被证明是有效的,递归特征消除(RFE)在特征选择中被证明是有效的,但通过RFE集成来增强MF的潜力仍未被探索。 11月8日,我们看到在期刊《BMC Medica
【浙中大郑老师撰写的”统计杂谈“系列文章】 现在对医学研究缺失数据填补的问题,很多人都有了一定的思考,
在我们的临床研究中,很难得到高质量的数据。 以医院数据为例,收集的数据不够完整,存在缺失,这些缺失数据如同鸡肋,食之无味,弃之可惜。 所以,现在对医学研究缺失数据填补的问题,很多人都有了一定的思考,有缺失,还是要填补,无论是临床试验、调查研究,无论是前瞻性还是回顾性。
现在对医学研究缺失数据填补的问题,很多人都有了一定的思考,有缺失,还是要填补,无论是临床试验、调查研究,无论是前瞻性还是回顾性。 但我们都知道缺失数据填补不能随便填,一个变量,过高比例的缺失,填回去也没有价值。
Zstats交流群
联系助教
请输入助教告诉您的积分券
如果不填写积分券,将直接使用当前余额支付
请稍候,正在为您生成支付订单
请使用扫描二维码完成支付
二维码获取失败
支付二维码获取失败,请点击重新获取
请稍候,正在为您完成支付
正在使用积分券兑换,然后完成支付 正在使用当前余额完成支付
您的订单已支付完成,页面将在 秒后自动关闭
支付过程中出现错误,请重新选择支付方式