Clear Sky Science · es

Un marco unificado basado en EfficientSwinB para el reconocimiento de plantas medicinales y la clasificación del germoplasma del cártamo

· Volver al índice

Por qué importa una identificación de plantas más inteligente

Desde las hierbas de cocina hasta los remedios tradicionales, muchas plantas que sostienen nuestra salud se parecen sorprendentemente entre sí. Distinguirlas a simple vista requiere años de formación, y los errores pueden afectar la calidad de los medicamentos, las decisiones agrícolas y los esfuerzos por proteger la biodiversidad. Este estudio presenta un nuevo marco de inteligencia artificial (IA) que puede reconocer plantas medicinales a partir de fotografías cotidianas e incluso distinguir variedades de cártamo muy estrechamente relacionadas a partir de sus hojas. Al hacer la identificación de plantas más rápida y fiable, el trabajo apunta a herramientas prácticas para farmacéuticos, agricultores y conservacionistas.

Figure 1
Figure 1.

De instantáneas de hojas a respuestas fiables

Los autores se centran en una de las versiones más difíciles del reconocimiento de plantas: trabajar directamente con imágenes de hojas. Las fotos al aire libre de plantas medicinales están llenas de tierra, sombras y otras plantas, mientras que muchas especies comparten formas y patrones de venación casi idénticos. Los métodos tradicionales de visión por ordenador necesitaban grandes conjuntos de datos cuidadosamente curados y aun así tenían dificultades con esa variación. Aquí, los investigadores se apoyan en una familia moderna de modelos de IA llamados transformadores de visión, que tratan una imagen como una colección de pequeños parches y aprenden cómo se relacionan entre sí esas piezas. Su objetivo es diseñar un único marco que pueda manejar tanto el reconocimiento amplio de especies en el campo como las distinciones finas entre variedades de cultivo en laboratorio.

Un ojo más ligero y preciso para las plantas medicinales

Para el reconocimiento general de plantas medicinales, el equipo propone un modelo que llaman EfficientSwinB-SE. Parte del Swin Transformer, un transformador de visión popular que examina ventanas superpuestas de una imagen para captar tanto detalles locales como la escena global. La primera mejora es un paso de poda: el modelo elimina automáticamente las conexiones menos útiles en su capa inicial de procesamiento de imagen, aligerando sus cálculos internos sin cambiar la estructura general. La segunda mejora es un bloque squeeze-and-excitation, que enseña al modelo a ponderar algunos canales visuales más que otros, de forma similar a un botánico que presta especial atención a la estructura de las venas o a la textura de los bordes mientras ignora píxeles de fondo que distraen.

Acercándose a las diferencias dentro de la familia del cártamo

Reconocer variedades dentro de un mismo cultivo es aún más difícil que distinguir especies diferentes, porque las diferencias visuales pueden ser extremadamente sutiles. Para afrontar esto, los autores extienden su marco a un segundo modelo llamado OLSF-EfficientSwinB-SE, diseñado para el germoplasma del cártamo—las líneas genéticas usadas en el mejoramiento. En un entorno de laboratorio, primero mejoran las imágenes de las hojas con un proceso de “Característica Óptima de Estructura de Hoja” que resalta las direcciones de las venas y la textura fina. Estas imágenes mejoradas se introducen luego en la misma columna vertebral del transformador podada y atenta. Esta combinación ayuda a la IA a centrarse en señales estructurales diminutas pero biológicamente significativas que distinguen una línea de cártamo de otra, apoyando un mejoramiento más preciso y la gestión de recursos genéticos.

Figure 2
Figure 2.

Poniendo a prueba el nuevo marco

Los investigadores evalúan sus modelos en tres conjuntos de datos públicos: plantas medicinales indias fotografiadas en jardines, plantas medicinales indonesias recopiladas de diversas fuentes en línea y un conjunto de datos de cártamo que contiene docenas de variedades imagenadas bajo condiciones de laboratorio controladas. En todos los casos, EfficientSwinB-SE supera a modelos conocidos de aprendizaje profundo, incluidos las redes convolucionales clásicas y otros transformadores. Alcanza aproximadamente un 99,75 % de exactitud en el conjunto indio y un 97,70 % en el indonesio, incluso bajo iluminación variable y fondos desordenados. Para la tarea de cártamo de gran finura, la variante OLSF-EfficientSwinB-SE logra alrededor de un 91,63 % de exactitud, superando a un enfoque previo basado en transformadores diseñado específicamente para este cultivo.

Qué significa esto para el uso real de las plantas

En términos cotidianos, el estudio muestra que es posible construir un “ojo” de IA único y eficiente que pueda tanto reconocer una amplia gama de plantas medicinales en el campo como clasificar de forma fiable hojas casi idénticas en el laboratorio. Al recortar cálculos innecesarios y enseñar al modelo a enfatizar las señales visuales más informativas, los autores crean herramientas que son precisas, robustas y lo bastante prácticas para un uso casi en tiempo real. Tales sistemas podrían sustentar aplicaciones móviles para identificación de hierbas, catalogación automatizada de recursos genéticos y plataformas agrícolas inteligentes que rastreen cultivos por sus hojas. A medida que las mismas ideas se extiendan a más especies y entornos, podrían ayudar a tender un puente entre el conocimiento tradicional de las plantas y la agricultura moderna basada en datos.

Cita: Khuat, P.T., Thien Van, H. A unified EfficientSwinB-based framework for medicinal plant recognition and safflower germplasm classification. Sci Rep 16, 11791 (2026). https://doi.org/10.1038/s41598-026-42449-4

Palabras clave: reconocimiento de plantas medicinales, aprendizaje profundo, transformador de visión, germoplasma de cártamo, identificación de plantas