Clear Sky Science · zh

在边缘计算环境中用于番茄病害分类的轻量级深度学习模型的全面评估

2026-03-05 · 返回目录

为番茄植株配备更聪明的“眼睛”

全球范围内，番茄作物因叶部疾病损失了大量潜在产量。如今，农民可以用手机或田间相机拍摄叶片照片，让人工智能（AI）及早发现问题。但存在一个问题：许多最准确的 AI 模型过于庞大，无法在田间和温室中低成本设备上运行。本研究提出一个实用问题：哪些紧凑型 AI 模型既能准确识别番茄病害，又能在靠近植株的小型廉价硬件上快速运行？

为什么番茄叶片照片很重要

番茄病害通常首先在叶片上表现为斑点、霉斑或变色，及早发现可防止严重的产量损失。作者基于一个流行的公开图像库 PlantVillage，聚焦于超过 1.8 万张番茄叶片照片，涵盖九种病害以及健康植株。所有图像在训练时都被标准化并进行了轻度增强，以模拟光照、缩放和位置小幅移动等真实世界变化。这使研究人员能够测试不同 AI 模型在识别视觉模式方面的能力，例如区分早疫病与晚疫病，或将健康叶片与受病毒感染的叶片区分开来。

比较多种小型类脑模型

团队没有仅仅再设计一个新模型，而是为七种紧凑深度学习架构搭建了公平竞赛。其中一些是曾在多项任务中取得成功的经典图像识别网络，如 VGG16、ResNet50 和 DenseNet121。另一些是为手机和嵌入式设备运行而专门设计的新型结构，如 MobileNetV3-Small、ShuffleNetV2 和 SqueezeNet。最后一位参赛者 MobilePlantViT 是一种混合体，结合了传统卷积层以捕捉图像小范围的细节，以及类变换器（transformer）注意力机制以链接叶片中远距离区域，从而理解整体的病害模式。

洞察 AI 的决策过程

对农民和农艺师而言，仅有高准确率还不够——模型还必须可被理解。因此，作者使用了三种流行的“可解释 AI”技术，在每张叶片图像上生成热图，展示哪些区域对决策影响最大，分别是 Grad-CAM、LIME 和 SHAP。为了超越对这些彩色图谱的目测评估，团队提出了一个名为扰动稳定性评分（Perturbation Stability Score）的新评分方法。通过多次向图像添加少量噪声并比较解释图的变化，他们可以衡量每种解释方法的稳定性和可靠性。跨模型比较中，SHAP 倾向于提供最稳定的解释，而 Grad-CAM 则给出与人类预期高度一致的清晰、高分辨率的病变高亮区域。

在真实设备上的速度与功耗

由于农业工具通常依赖于无图形芯片的低成本处理器，研究人员测量了每个模型在标准桌面 CPU 和 Raspberry Pi 5（一种小型且价格低廉的计算机，可与智能相机使用的硬件相媲美）上的运行速度。评估指标包括模型大小、每张图像的基本算力操作数，以及在不同线程设置下处理单张照片所需的时间。像 VGG16 这样的标准网络虽然准确性出色，但体积庞大且运行缓慢；而像 SqueezeNet 这样的小型模型运行迅速，但在更具挑战性的噪声或田间条件下会牺牲部分精度。MobilePlantViT 表现突出：在干净图像上其准确率超过 99%，在更现实的测试中仍具竞争力，同时仅占用极少的内存与计算资源，即便在受限硬件上也能实现近实时性能。

这对未来智慧农场意味着什么

总体而言，该研究表明，精心设计的轻量级模型能够将高端图像识别能力带到田间边缘，在连接和电力受限的环境中发挥作用。在所有测试的架构中，MobilePlantViT 在诊断准确性、计算资源使用效率以及对模型“关注”区域的清晰可视化解释方面提供了最佳组合。对种植者和技术开发者而言，这指向了一个未来：小型、廉价的设备可安装在手机、无人机或温室轨道上，持续扫描番茄植株、标出可疑叶片，并以农艺师可验证和信赖的方式说明其警报原因。

引用: Hoang, TM., Bui, VH., Nguyen, VS. et al. A comprehensive evaluation of lightweight deep learning models for tomato disease classification on edge computing environments. Sci Rep 16, 12320 (2026). https://doi.org/10.1038/s41598-026-42439-6

关键词: 番茄病害检测, 边缘人工智能, 轻量级深度学习, 视觉变换器, 可解释的人工智能