三区论文都用上双重机器学习与精准医学的统计分析方法

今天我们分享一篇发表在《Scientific Reports》的研究论文，研究团队旨在应用双重机器学习（DML）框架，探讨了司库奇尤单抗从150mg升至300mg对疾病活动度和生活质量的个体化因果效应。

126

2026-04-21

自动机器+双重机器学习，复杂数据因果推断正确打开方式

今天分享一篇基于自动机器学习（AutoML）与双重机器学习（DML）相结合的研究，作者系统评估了中国67个城市饮用水中ARGs的驱动因素，并实现了从“关联挖掘”到“因果验证”的完整分析框架。

171

2026-04-13

中国学者用三种策略找到放射组学预测模型的最佳算法

由于可以使用大量数据进行训练，还能整合基因图谱、影像、脑电图、生理数据等多种数据源，因此机器学习（ML）算法特别适合个体化医疗。今天分享一篇基于集成机器学习，结合从医疗记录中提取的多模态临床和放射学特征，开发和验证一种非侵入性、临床适用的预测模型的研究论文。

2026-04-01

基于中医证候预测胃癌前病变，清华学者机器学习预测模型

胃癌前病变（PLGC）是胃癌进展的关键阶段，及时干预可显著降低死亡率。然而，当前筛查策略主要依赖内窥镜检查，不仅费用高、侵入性，在资源有限地区更是难以普及。

128

2026-03-19

二区Top文章的临床预测模型，用了8种机器学习方法，但不靠谱

在该项研究中，研究团队使用了去身份化电子健康记录（EHR）数据，纳入老年患者。本研究旨在基于8种机器学习法和SHAP法，构建可解释机器学习预测模型，以评估风险因素并预测老年心合并高血压患者的住院死亡率。 √缺失数据的处理研究中所有变量的缺失数据比例均保持在30%以下，使用K-最近邻（KNN）分类算法对缺失数据进行处理。 √变量筛选使用LASSO法在44个变量中筛选出9个最佳预测因子，包括年龄、住院时间（LOS）、中性粒细胞（Neu）、尿素、Cl、活化部分凝血活酶时间（APTT）、白细胞（LEU）、白蛋白和HDL胆固醇。

413

2025-08-05

机器学习预测模型发文Lancet子刊，首次看到10倍EPV样本量用公式展示

【欢迎阅读浙中大郑老师撰写的统计科普文】预测模型文章中，我们一般用10倍EPV原则计算样本量，这也是目前公认的方法，但很少有学者会在文章中详细地解释。

985

2025-07-17

IF=23.1！生存分析预测模型，随机生存森林方法比Cox回归更优？

医学一区，IF=23.1的杂志《Blood》刊登了一篇机器学习预测模型的研究，题为：“Use of machine learning techniques to predict poor survival after hematopoietic cell transplantation for my

502

2025-07-11