Clear Sky Science · zh
基于统一 EfficientSwinB 框架的药用植物识别与红花种质分类
为什么更智能的植物识别重要
从厨房香草到传统草药,许多对健康有益的植物外观极为相似。仅凭肉眼区分它们需要多年训练,错误识别会影响药材质量、农事决策以及生物多样性保护工作。本研究提出了一个新的人工智能(AI)框架,能够从日常照片中识别药用植物,甚至仅凭叶片区分极为相近的红花品系。通过使植物鉴定更快、更可靠,这项工作朝着为药剂师、农民和保护工作者提供实用工具的方向迈进。

从叶片快照到可信答案
作者聚焦于植物识别中最困难的场景之一:直接从叶片图像出发。室外拍摄的药用植物照片常有泥土、阴影和其他植物的干扰,而许多物种在形状和叶脉纹理上几乎相同。传统计算机视觉方法依赖大规模且精心整理的数据集,仍难以应对这些变异。研究者在此基础上使用一种现代的 AI 模型家族——视觉变换器,该模型将图像视为若干小块并学习这些局部之间的关系。其目标是设计一个单一框架,既能应对野外的广泛物种识别,又能在实验室中实现对作物品系的细粒度区分。
为药用植物打造更精简、更敏锐的“目光”
在通用药用植物识别方面,团队提出了名为 EfficientSwinB-SE 的模型。它以流行的 Swin Transformer 为起点,该模型通过查看图像的重叠窗口来同时捕捉局部细节和整体场景。第一个改进是剪枝步骤:模型自动去除早期图像处理层中最不重要的连接,从而在不改变整体结构的情况下简化内部计算。第二个改进是 squeeze-and-excitation(挤压与激励)模块,它教会模型对某些视觉通道赋予更高权重,就像植物学家在辨识时会特别关注叶脉结构或边缘纹理,而忽略干扰性的背景像素。
聚焦红花家族的细微差异
在单一作物内部识别品系比区分不同物种更具挑战性,因为视觉差异可能极其微小。为应对这一点,作者将框架扩展为第二个模型 OLSF-EfficientSwinB-SE,专门用于红花种质——育种中使用的遗传谱系。在实验室环境中,他们首先用一种“最优叶片结构特征”(Optimal Leaf Structure Feature)处理增强叶片图像,强调叶脉方向和细微纹理。这些增强图像随后输入同一经过剪枝和注意力增强的变换器骨干。该组合帮助 AI 将注意力集中在能够生物学上区分不同红花品系的微小但重要的结构特征上,从而支持更精确的育种与遗传资源管理。

将新框架付诸测试
研究者在三个公开数据集上评估他们的模型:在花园中拍摄的印度药用植物、来自多样在线来源的印度尼西亚药用植物,以及在受控实验室条件下拍摄的包含数十个品系的红花数据集。总体上,EfficientSwinB-SE 优于多种知名深度学习模型,包括经典卷积网络和其他变换器。在印度数据集上它达到约 99.75% 的准确率,在印度尼西亚数据集上约为 97.70%,即便在光照变化和杂乱背景下仍表现良好。对于细粒度的红花任务,OLSF-EfficientSwinB-SE 变体取得了约 91.63% 的准确率,超过了先前为该作物专门设计的基于变换器的方法。
这对现实世界中植物利用意味着什么
通俗来说,该研究表明可以构建一个单一、高效的 AI“之眼”,既能在野外识别多种药用植物,又能在实验室中可靠地区分几乎相同的叶片。通过削减不必要的计算并教会模型强调最有信息量的视觉线索,作者打造出准确、稳健且足够实用以接近实时应用的工具。此类系统可支持用于草药识别的手机应用、遗传资源的自动编目,以及通过叶片追踪作物的智能农业平台。随着这些理念扩展到更多物种和环境,它们有望在传统植物知识与现代数据驱动农业之间架起桥梁。
引用: Khuat, P.T., Thien Van, H. A unified EfficientSwinB-based framework for medicinal plant recognition and safflower germplasm classification. Sci Rep 16, 11791 (2026). https://doi.org/10.1038/s41598-026-42449-4
关键词: 药用植物识别, 深度学习, 视觉变换器, 红花种质, 植物鉴定