--
菜单
无障碍浏览
银湾研究院 > 研究项目 > 论文产出

利用机器学习方法预测全国健康体检项目中的未参与人群

时间 : 2025-02-21 10:10:56来源 : 银湾研究院 【字体: 视力保护色:

银湾研究院资深研究员参与发表题为《利用机器学习方法预测全国健康体检项目中的未参与人群》的研究论文。该研究聚焦日本自 2008 年启动全国性一般健康体检与健康指导项目以来面临的关键公共卫生挑战,即如何更有效地识别和干预最可能不参加体检的人群,从而提升健康体检参与率并优化公共卫生资源配置。

研究基于日本某地方政府数据库开展,纳入 7290 名 40–74 岁、在 2012 至 2015 年间至少参加过一次一般健康体检的个体。研究团队利用机器学习方法构建了四类预测模型,分别基于极端梯度提升(XGBoost)、随机森林(Random Forest)、支持向量机(SVM)和逻辑回归(Logistic Regression)算法,并将其与传统启发式方法进行比较。该启发式方法假设前一年参加过健康体检的人,下一年也更可能继续参加。

研究结果表明,机器学习模型在识别未来可能不参与健康体检的人群方面明显优于传统启发式方法。XGBoost 模型表现最佳,其受试者工作特征曲线下面积(AUC)为 0.829(95% CI: 0.806–0.853);随机森林、支持向量机和逻辑回归模型的 AUC 分别为 0.821、0.812 和 0.816,而传统启发式方法的 AUC 仅为 0.683。统计分析显示,XGBoost 模型的预测性能显著优于支持向量机、逻辑回归以及启发式方法。

该研究说明,基于机器学习技术建立的预测模型能够更精准地识别健康体检体系中的潜在未参与者,从而为地方政府或公共卫生机构提供更高效的干预对象筛选工具。相比依赖既往经验规则的粗略判断方法,数据驱动的预测模型能够更充分地利用多维个体信息,提高资源投放的针对性。

研究还揭示了影响体检参与行为的重要预测变量,为制定更精准的健康促进政策提供了依据。研究团队认为,这一方法学框架不仅有助于改善健康体检项目的参与率,也可推广应用于其他公共卫生服务项目中的目标人群识别与精细化管理。

本研究展示了机器学习方法在公共卫生管理和健康服务优化中的实际应用潜力,也体现了银湾研究院在数据科学与健康政策交叉研究领域的持续探索。通过将预测建模引入公共卫生干预设计,研究有望为提升预防性卫生服务的覆盖率与公平性提供新的技术路径。

论文信息:
Using machine-learning approaches to predict non-participation in a nationwide general health check-up scheme.
Akihiro Shimoda, Daisuke Ichikawa, Hiroshi Oyama.
Computer Methods and Programs in Biomedicine, 2018.
DOI: 10.1016/j.cmpb.2018.05.032

-