Clear Sky Science · zh

使用监督式机器学习分析 28 国 DHS 数据来预测撒哈拉以南非洲家庭的烹饪燃料选择

· 返回目录

家庭烹饪方式为何重要

在撒哈拉以南非洲,大多数家庭仍使用木材、木炭或作物残余等产生浓烟的燃料生火做饭。这一日常习惯带来深刻后果:损害呼吸健康、加剧气候变化,并反映出收入和基础服务(如电力)可及性方面的深刻不平等。这里总结的研究提出了一个非常务实的问题:基于我们对家庭的已知信息——收入、受教育程度、电力可及性以及居住地——能否可靠地预测其使用的是清洁燃料还是污染性燃料?如果可以,这对如何加快数亿人转向更安全的烹饪方式有何启示?

Figure 1
Figure 1.

观察 28 个国家的日常生活

研究人员利用了来自撒哈拉以南非洲 28 个国家的详细家庭调查数据,涵盖 2015 到 2024 年间超过 43 万个家庭。这些调查在许多方面询问家庭情况,其中包括主要使用何种燃料做饭。研究团队将电力、液化石油气(LPG)、天然气和沼气归为“清洁”选项,而煤油、煤、木炭、柴火、作物残余和动物粪便等列为“非清洁”燃料。他们还纳入了户主的年龄和性别、家庭规模、幼儿数量、受教育年限、财富状况、是否通电以及是否拥有收音机或电视等信息。这些细节共同勾勒出家庭生活、工作以及获取信息和服务的广阔图景。

教计算机识别燃料使用模式

为了揭示传统统计方法难以捕捉的复杂模式,作者使用了若干监督式机器学习方法——让计算机通过样本学习的模型。他们在 80% 的数据上训练了七种不同模型,包括决策树、随机森林、人工神经网络以及一种强大的提升方法 XGBoost,并在剩余 20% 的数据上进行测试。由于使用清洁燃料的家庭远少于使用污染燃料的家庭,训练时对数据进行了平衡处理,以免模型仅学会预测多数类。模型的评判标准包括预测正确率、识别清洁燃料用户的能力以及区分清洁与非清洁选择的明晰度。XGBoost 表现最佳,大约五分之四的情况下正确预测了燃料类型,并显示出出色的群体区分能力。

Figure 2
Figure 2.

影响更清洁烹饪的关键因素

良好的预测很有价值,但决策者更需要知道驱动这些预测的因素。为了解开“黑箱”,团队使用了一种称为 SHAP 的技术,能显示每个因素在多大程度上推动模型预测为清洁或非清洁燃料。影响最大的单一因素是家庭是否接通电力。没有电的家庭更可能依赖冒烟的燃料,尤其当其同时贫困时。其他与清洁烹饪高度相关的强信号包括居住在城市而非农村、受教育程度更高以及拥有电视——这些通常与更高收入和更好的信息可及性相关。收音机拥有情况、家庭规模、幼儿数量以及烹饪地点(室内、独立小屋或户外)也有影响,但程度较小。

地区内进展不均

尽管城市化和电网扩展在推进,研究发现在这 28 个国家中仍有 84% 的家庭使用非清洁燃料做饭。在一些国家——例如布隆迪、马达加斯加、塞拉利昂、马拉维、利比里亚和几内亚——超过 95% 的家庭依赖传统生物质燃料。只有少数地方,尤其是南非和加蓬,大多数家庭使用了更清洁的选项。在国家内部,同样的差距也存在:富裕、城市化且受教育程度较高并有电力的家庭更有可能转向 LPG 或电烹饪,而贫困的农村家庭仍然采集木材或购买木炭。这些模式表明进展是可能的,但不均衡,且与资金、基础设施和信息密切相关。

对民众与政策的意义

对非专业读者而言,核心信息很明确:我们现在有了一种基于数据的方法,可以识别哪些社区最有可能暴露于有害的烹饪烟雾中以及原因。研究表明,扩展可靠且负担得起的电力、缩小城乡差距、改善教育以及提高家庭收入,都是清洁化烹饪的关键。借助准确的预测工具,政府和援助组织可以更有针对性地部署通电项目、燃料补贴和宣传活动,将资源投向最需要的家庭。简单来说,这项研究将分散的调查答案转化为一张实用的地图,帮助数百万家庭用更安全、更清洁的厨房取代冒烟的炉火。

引用: Demoze, L., Asnake, A.A., Gebrehana, A.K. et al. Predicting household cooking fuel choice in sub-Saharan Africa using supervised machine learning analysis of DHS data from 28 countries. Sci Rep 16, 14208 (2026). https://doi.org/10.1038/s41598-026-44937-z

关键词: 清洁烹饪, 家庭能源, 撒哈拉以南非洲, 机器学习, 电力可及性