Clear Sky Science · zh
用于复杂农业环境中轻量且鲁棒的小麦穗检测的双向状态空间建模
从空中计数小麦穗为何重要
养活不断增长的人口依赖于对田间能产出多少食物的准确了解,而小麦穗——每株植株上孕育谷粒的穗端——是一个关键线索。农民和育种者长期以来通过人工计数来估算产量,但在大面积田地中这样做既慢又费钱,而且容易出错。本研究提出了一种新的计算机视觉系统 Mamba-WheatNet,利用无人机图像实时自动识别并计数小麦穗,即便田地杂乱、拥挤且受瞬变光照影响时仍能工作。
复杂农田上的智能“眼睛”
真实田地远非整洁。小麦穗可能被叶片遮挡、彼此重叠,或与杂草和裸土混杂,且它们的颜色和形状会随着生长阶段变化。以往方法试图依赖诸如颜色或纹理等简单特征,但当光照或生长阶段改变时这些方法容易失效。深度学习通过让神经网络直接从大量图像中学习模式改善了情况。然而,许多现有模型在复杂场景中仍然吃力,并且往往需要昂贵的计算资源,这在无人机或小型现场设备上难以部署。

关注关键要素的轻量模型
Mamba-WheatNet 的设计旨在应对这些挑战,同时保持足够轻量以适用于实际农业场景。它结合了两种主要思想:高效的卷积层,擅长捕捉局部细节;以及一种称为选择性状态空间的新型模型家族,擅长跟踪远程模式。作者构建了一个特征提取器,先将图像分解为多尺度模式,然后通过一个特殊的融合阶段横向观察整个场景。这有助于系统忽略背景杂波(如重叠的叶片或土壤),更关注标识单个小麦穗的细微形状和色调。
模型如何解开密集小麦穗的纠缠
在 Mamba-WheatNet 内部,两个定制的构建模块承担了大量核心工作。其一称为残差深度可分离块(Residual Depthwise Separable Block),它使用沿通道分离的轻量卷积来捕捉细节,同时不会显著增加计算量。另一称为双向空间扫描块(Bidirectional Spatial Scanning Block),它在水平和垂直方向扫描特征图,双向收集上下文信息,并有选择地强调最有信息量的通道。这些组件被组合到一个更大的融合单元中,混合局部与全局线索,从而更容易区分相互接触或重叠的小麦穗,并在空中图像中小穗或高度密集时保持检测准确性。

对系统进行实测
为评估其在现实条件下的表现,研究人员在 GWHD-2021 上训练并测试了 Mamba-WheatNet,这是一个大型公开无人机小麦田图像集,覆盖多种品种、种植布局和生长阶段。他们将该系统与若干领先的目标检测器(包括最新的 YOLO 模型和基于变换器的网络)进行了比较。Mamba-WheatNet 在精确率和召回率上均取得更高的表现,并在总体检测评分上略有领先,同时使用的计算资源适中且运行速度足以满足近实时需求。团队还检验了模型向另一个无人机数据集 VisDrone2019 的迁移能力,该数据集包含许多类型的小目标并且场景拥挤。在那里,该模型在紧凑型检测器中也表现出最佳准确率,表明其设计可以超越小麦场景推广应用。
对未来智能农业的意义
研究结论认为,Mamba-WheatNet 提供了一种实用且准确的空中小麦穗计数方法,即使在视觉复杂的田块中亦能有效。通过将轻量高效的层与全局扫描机制谨慎结合,模型在不超载典型无人机或田间机器人硬件的前提下捕捉细微模式。对农民、育种者和农艺师来说,这可能意味着更快速、更可靠的产量估算以及更好的作物健康监测,推动农业向更数据驱动和更精确的管理转型。
引用: Deng, G., Li, Z. & Gao, Z. Bidirectional state space modeling for lightweight and robust wheat head detection in complex agricultural environments. Sci Rep 16, 14895 (2026). https://doi.org/10.1038/s41598-026-45083-2
关键词: 小麦穗检测, 无人机影像, 深度学习, 精准农业, 目标检测