Clear Sky Science · zh
针对实时棉花昆虫检测的增强型 YOLO12 与空间金字塔池化
为何发现微小昆虫至关重要
棉花看似普通,但其全球作用巨大:为数十亿人提供衣物,支持数百万个就业岗位,并为食用油到化妆品等多个产业提供原料。然而,整片棉田可能会被比米粒还小的昆虫悄然侵蚀。农民通常依赖频繁的田间巡查和大量农药来控制这些害虫——这些方法耗时、成本高且对环境不利。本研究探讨了一种新的人工智能形式,如何实时监控棉田,自动在叶片上识别有害昆虫,从而使防治更有针对性、减少浪费。

从人工巡查到智能摄像
如今,许多农民或田间工人仍沿着棉行走,目视检查叶片和花朵是否有害虫。该方法受限于人体疲劳、覆盖不均以及光照和天气变化。按固定时间表喷洒的广谱农药往往并非基于实际需求,可能杀死有益昆虫、污染土壤和水体,并提高生产成本。作者认为,更可持续的方向是让计算机直接“看见”田间照片中的昆虫,为农民提供自动化的预警系统,仅在害虫出现处精确采取防治措施。
教会计算机识别微小害虫
为构建这样的系统,研究人员转向深度学习——一种擅长从图像中识别模式的人工智能分支。他们使用了一类称为 YOLO(“You Only Look Once”)的模型,能够在极短时间内扫描图像并绘制目标框。在最新的 YOLO12 模型基础上,团队构建了一个针对棉花害虫优化的增强版本。首先,他们整理并精炼了一个高质量的开放数据集,包含来自真实棉田的 3,225 张照片,覆盖瓢虫、臭虫、棉铃虫等 13 种常见昆虫。他们将原始标注转换为模型可读的标准格式,并仔细平衡每个昆虫类别的图像数量,以避免 AI 偏向数量较多的物种。
让微小昆虫更易被识别
在叶片上检测昆虫比识别汽车或行人等大目标困难得多。昆虫体积很小,常常伪装,并且可能出现在多种尺度和角度。为应对这些挑战,团队在 YOLO12 架构上做了多项改进。他们添加了专门的构建模块,帮助模型在把握整体场景的同时捕捉细节。“空间金字塔池化”模块使网络能够在多个尺度同时观察同一区域,这对于在同一图像中同时识别极小和稍大的昆虫至关重要。随后引入的注意力机制帮助模型强调图像中最有信息量的部分——区分不同昆虫的细微形状、颜色和纹理——同时忽略背景噪声。
对模型进行实测
作者不仅提出了单一模型,而是构建并比较了六种不同的基于 YOLO 的设计,包括标准的 YOLO11 与 YOLO12 以及若干定制变体。所有模型均在相同的棉花昆虫数据集上训练和测试,以确保公平比较。表现最突出的是名为 Enhanced Hybrid YOLO12 的模型,在标准检测质量度量上得分很高,兼顾了检测的召回率和边界框定位的精确性。与原始 YOLO12 相比,该模型在整体检测质量和在不同测试条件下的一致性上都有提升,同时在现代图形硬件上仍能实现实时运行。尽管该增强模型在计算上略重,作者表明其在现实农业中的可靠性提升具有特别的价值。

对农民和环境的意义
通俗地说,研究表明一台摄像机加上经过训练的 AI 模型,能够像不知疲倦的数字侦察兵一样昼夜扫描棉叶以查找害虫。由于 Enhanced Hybrid YOLO12 系统比早期版本更能避免误报,它可以帮助农民仅在真正有害虫时进行喷洒,从而减少化学品使用、节省开支并降低对有益物种和周边生态的伤害。尽管仍需进一步工作以便在低成本设备上运行模型并将其扩展到更多昆虫种类和种植区域,这项研究指向了一个前景:精准农业将害虫防治从凭经验转向以数据为驱动的行动。
引用: Saif, D., Askr, H., Sarhan, A.M. et al. Enhanced YOLO12 with spatial pyramid pooling for real-time cotton insect detection. Sci Rep 16, 4806 (2026). https://doi.org/10.1038/s41598-026-35747-4
关键词: 棉花害虫, 精准农业, 深度学习, 目标检测, 可持续农业