碘缺乏症(ID) 是指从胚胎发育至成人期由于碘摄入量不足而引起的一系列病症,可能导致甲状腺肿大、认知障碍等严重后果。
准确预测未来趋势对制定干预策略至关重要,但传统模型难以捕捉动态变化。因此,本研究引入机器学习方法,探索ID的长期演变规律。
2025年2月4日,暨南大学学者用GBD 2021数据库,在期刊《Advances in Nutrition》(医学top一区,IF=8.0)发表题为:“Global Burden of Iodine Deficiency: Insights and Projections to 2050 Using XGBoost and SHAP”的研究论文。
在本研究中,研究团队分析了1990年至2021年,碘缺乏症(ID)全球和区域负担的趋势,并使用XGBoost模型预测了到2050年的疾病负担。此外,还进一步采用SHAP法确定影响ID发病的关键因素。
研究团队基于GBD 2021数据库的数据,获得了1990年至2021年204个国家和地区碘缺乏症(ID)的发病率、患病率和伤残调整生命年(DALYs),用于评估碘缺乏症的全球负担。
结果显示,在过去三十年里,虽然ID负担总体下降,但由于社会经济条件差和教育有限等原因,撒哈拉以南非洲中部、东部以及南亚等低SDI地区的ID负担仍然很高。
图1 1990年和2021年,ID的全球负担
同时,由于碘的摄入与甲状腺激素的分泌密切相关,而女性的甲状腺激素需求更高,ID负担也就更重!尤其在10-30岁的年轻女性群体中,发病率比男性高出近一倍。
图2 不同年龄、时期和出生队列对ID全球负担的影响
以性别、年龄、年份和人口规模为预测因子,研究团队构建了原始的XGBoost模型,预测ID的发病率、患病率和DALY率,其结果与GBD 2021数据库的结果一致,表明了模型的准确性。
原始的XGBoost模型预计到2050年,撒哈拉以南非洲中部、东部以及南亚的ID负担仍最高,同时女性的ID负担也显著高于男性。
SHAP法对该模型的分析揭示,性别、年龄是ID负担的关键危险因素,其中女性和年轻人群是ID的高危人群。
图3 原始的XGBoost模型中特征的SHAP法分析
同时,为了探究碘盐覆盖率对ID负担的影响,研究团队以性别、年龄、碘盐覆盖率和人口规模为预测因子,进一步了构建基于碘盐覆盖率的XGBoost模型,数据来源于世界卫生组织(WHO)中66个国家的碘盐覆盖率数据。
进一步的SHAP法分析揭示,足够的碘盐覆盖率是降低ID负担的核心因素,不过阈值因地区而异(如刚果民主共和国需覆盖77%,而埃塞俄比亚只需覆盖50%即可)。
图4 1990年、2021年碘盐覆盖率与ID年龄标准化发病率、 年龄标准化患病率的关联
图5 刚果、刚果民主共和国和埃塞俄比亚的碘盐覆盖率与ID发病率的SHAP依赖图
综上所述,研究团队确定了年龄、性别和碘盐覆盖率是碘缺乏症的关键危险因素,其中年轻女性是高危人群。并且未来几十年内,碘缺乏症将继续对发展水平较低的国家构成威胁,比如撒哈拉以南非洲中部、东部以及南亚地区。
机器学习联合公共数据是目前发文的热门方向,但机器学习联合GBD数据的文章,确实少见!想要发文的小伙伴可要抓紧了!
如果你想要解锁更多GBD的优秀选题,郑老师团队的一对一GBD统计服务绝对是不二之选!此外,想了解更多机器学习内容的朋友,郑老师也提供相应的机器学习课程!