Clear Sky Science · zh

CTRNet:一种用于田间玉米叶卷识别的轻量高效深度学习模型

· 返回目录

为什么发现被藏的叶心很重要

在夏季的玉米地里,一些最具破坏力的害虫直接攻击植株的“心脏”——顶部紧密螺旋状的叶丛,称为叶卷(whorl)。这些害虫体型小,攻击目标更小,农民常常不得不对大面积喷药以防万一。本研究提出了一种新的计算机视觉系统 CTRNet,旨在可靠地在复杂的真实田间环境中定位微小的玉米叶卷,使作物监测和农药使用更加精确、减少浪费。

在广阔田间识别微小目标的挑战

对于害虫防治来说,准确知道叶卷位置至关重要,因为这是毛虫产卵与取食的主要部位,会降低光合作用并影响产量。但在真实田间环境中,叶卷很难被看清:在图像中显得很小,常被重叠的叶片遮挡,并且背景充斥着杂草、土壤与阴影。早期方法要么依赖人工目视检查,要么依靠基于颜色与纹理的简单图像处理技巧。这些方法只在干净、受控的场景中有效,一旦光照变化、叶片重叠或同时出现多种植株问题便迅速失效。

深度学习走向田间

近年来,尤其是 YOLO 系列的深度学习检测器大幅提升了机器实时识别图像中目标的能力。多个版本已被改用于作物与叶片检测,但标准模型在处理像玉米叶卷这样非常小的目标,以及户外不断变化的光照和叶片布局时仍然困难重重。图像在网络中被压缩时常会丢失细节,并容易被杂乱背景干扰。因此,作者基于现代的 YOLO11 模型,重新设计了网络的关键部分,以更好地捕捉微小结构、在不同尺度间共享信息,并忽略无关的背景模式。

Figure 1
Figure 1.

CTRNet 有何不同

所提出的 CTRNet(上下文与纹理增强表示网络)保留了 YOLO11 的速度与紧凑体积,同时加入了若干专门模块。其中一个模块促使网络的不同层之间交换信息,使得宏观上下文与微观细节在叶卷部分被遮挡时仍能相互补强。另一个模块同时针对粗糙、缓变的模式与细小、高频的细节进行调优,帮助保留标识叶卷中心的边缘与纹理。随后一个门控融合阶段将多尺度信号合并,同时抑制冗余或噪声特征。最后,一个注意力机制在进入检测器前重塑输入图像特征,以纠正高亮斑、阴影和复杂背景,防止它们干扰检测。

将系统付诸测试

为训练与测试 CTRNet,团队收集了来自公开来源与自有田间调查的 2,816 张图像,覆盖从幼苗到成熟植株的生长阶段。照片模拟了农业机器人相机的视角与高度,包含多种光照条件和田间布局。在与若干 YOLO 变体及一种基于变换器的检测器的直接比较中,CTRNet 在识别叶卷的准确性上名列前茅,将标准检测指标(mAP@0.5)从 81.6% 提高到 84.7%,且实际使用的模型参数少于基线模型。可视化对比显示,CTRNet 更加精确地聚焦于真实叶卷区域,并在低光、强光或严重遮挡场景中减少了对周围叶片或土壤的误检高亮。

Figure 2
Figure 2.

对行间作业的机器人来说足够快

除了准确性,作者还测试了 CTRNet 是否能在类似田间机器人所携带的小型边缘 AI 计算机上运行。在 NVIDIA Jetson Orin Nano 设备上,模型在结合优化的推理引擎与半精度运算时保持了实时帧率。这意味着 CTRNet 可以切实为喷洒器或巡检机器人提供即时指导,使其在行间移动时快速反应,而不必依赖缓慢的离线分析。

这对更智能的害虫防控意味着什么

简而言之,CTRNet 为机器提供了更锐利的“视觉”,能够识别玉米植株上一个虽小但重要的部位。通过在阴影、眩光与叶片遮挡下仍可靠地察觉叶卷,它支持更有针对性的害虫损害监测和更精确的农药施用。该工作表明,经过精心设计的轻量深度学习模型不仅能匹配更重型系统的性能,还能在速度与准确性上超越它们,为更智能、减少浪费的作物防护工具铺平道路,并有望推广到其他作物与病害检测系统中。

引用: Tian, X., Zhang, J. & Li, Y. CTRNet: a lightweight and efficient deep learning model for field maize whorl identification. Sci Rep 16, 10570 (2026). https://doi.org/10.1038/s41598-026-45727-3

关键词: 玉米害虫检测, 作物计算机视觉, 精准农业, 轻量深度学习, 田间机器人