Clear Sky Science · zh

一种基于土壤温度条件下使用随机森林与粒子群优化算法的土传蠕虫病(STH)物种分布预测新型混合模型

· 返回目录

为何地表温度关乎隐形感染

在尼日利亚的广大地区,数百万人暴露于生活在土壤中的微小寄生蠕虫,这些蠕虫可能在不被察觉的情况下损害儿童的生长并降低成年人的工作效率。这些感染的繁衍或消退取决于脚下几厘米深处土壤的温度。本研究探讨了如何将先进的计算算法与详尽的土壤温度数据相结合,以揭示这些寄生虫最有可能扩散的区域,帮助卫生工作者把有限资源集中投放到最需要的地方。

Figure 1
Figure 1.

我们脚下的隐形蠕虫

土传蠕虫是通过人体粪便污染环境并与受污染土壤接触而传播的肠道蠕虫。在尼日利亚,蛔虫、鞭虫和钩虫三种主要寄生虫仍然是重大公共卫生问题,尤其威胁儿童健康。它们的卵和幼虫在土壤中发育,而这一发育过程对温度极为敏感。以往的全球研究表明,存在一个“适宜范围”——大致上是温暖但不炽热——在该范围内这些寄生虫最为繁盛。然而,尽管有数十年的防控努力,仍难以准确确定哪些社区风险最高,部分原因是现有的感染地图未能充分捕捉土壤条件在景观上的变化。

把土壤热量转化为风险地图

为了解决这一难题,研究人员构建了尼日利亚地下气候的详细画像。他们利用了一个全球土壤数据集,该数据集提供了21个不同层次,描述了土壤温度在一年中的表现:平均温度、季节波动、极值以及0–5厘米深度每月的温度值。他们将这些层与来自国际被忽视疾病数据库的蠕虫感染地点数据进行了配对。由于许多记录仅显示发现感染的地点,研究团队还精心生成了“伪缺失”位置——即没有已知感染的地点——以教会模型区分适宜与不适宜的条件。

混合智能模型如何从土地中学习

本研究的核心是一种将两种思想融合的混合计算模型:决策树与群体行为。基础引擎为随机森林(Random Forest),其通过生长许多分支树,每棵树基于土壤条件做出简单的是/否决策,然后汇总投票以判断某地是否可能存在蠕虫。在此之上,团队加入了粒子群优化(Particle Swarm Optimization),这是一种受鸟群聚集或鱼群游动启发的方法。在该方案中,许多“粒子”在不同的模型参数组合和土壤温度特征选择间游走,互相推动,朝着能产生更精确预测的组合靠拢。

Figure 2
Figure 2.

用更少线索换来更精准的预测

当对比模型时,混合方法明显优于标准随机森林和更传统的人工神经网络。常规随机森林的准确率约为87%,神经网络约为81%,而经优化的混合模型攀升至约91%,并表现出更稳定的性能。值得注意的是,群体引导的模型在只使用大约一半可用土壤温度特征的情况下取得了这种改进,聚焦于少数几个月度和季节性温度模式,这些模式对蠕虫生存最为关键。统计检验证实了这些提升并非偶然。由此产生的尼日利亚适宜性地图揭示了明显的高适宜区,尤其集中在中部和中带地区,那里的土壤温度和变异性落在寄生虫偏好的范围内。

从计算代码到社区诊所

对非专业人士而言,核心信息很直接:通过教会计算机识别土壤如何升温以及这种暖度随时间变化的细微模式,我们可以绘制出更清晰的蠕虫感染持续存在地区地图。该研究的混合模型将地下温度转化为切实可行的行动指南,指明哪些区县应优先开展驱虫活动、改善卫生条件并进行持续监测。尽管该方法在尼日利亚开发,但相同方法可适配其他国家和其他依赖环境条件的疾病,将土壤与气候中的隐形变化转化为保护公共健康的具体工具。

引用: Adekunle, T.A., Ogunwande, JM.O., Ogundoyin, I.K. et al. A novel hybrid model for species distribution prediction of soil-transmitted helminthiasis (STH) under soil temperature conditions using Random Forest and Particle Swarm Optimization Algorithm. Sci Rep 16, 9594 (2026). https://doi.org/10.1038/s41598-025-31604-y

关键词: 土传蠕虫, 物种分布建模, 土壤温度, 机器学习, 尼日利亚