Clear Sky Science · es

Clasificación de crisantemos mediante transformador de fusión de espacios de color

· Volver al índice

Por qué el lugar de origen y el color de una flor importan de verdad

Los crisantemos son más que flores decorativas de otoño. En China, también son un remedio herbal tradicional y un cultivo valioso, pero sus propiedades medicinales y su precio en el mercado dependen en gran medida de la variedad de la planta y del lugar donde se cultivó. Hoy en día, distinguir un crisantemo medicinal de otro suele requerir ojos expertos, pruebas químicas o análisis genéticos: métodos lentos, caros y difíciles de aplicar en el campo. Este estudio presenta un método basado en cámara que permite a un ordenador clasificar crisantemos de forma rápida y precisa solo a partir de imágenes, examinando el color de una forma novedosa.

Ver las flores como lo hace una cámara

La mayoría de las fotos digitales almacenan el color como mezclas de rojo, verde y azul (RGB). Eso funciona bien para mostrar imágenes, pero no siempre coincide con cómo percibimos el brillo y los matices del color, especialmente cuando cambia la iluminación. Los autores toman las imágenes RGB habituales de las cabezas florales del crisantemo —especialmente de la parte trasera de las flores, que aporta información estructural y cromática rica— y las convierten a un segundo sistema de color conocido como LAB. En LAB, un canal refleja la luminancia (claro frente a oscuro), mientras que los otros dos describen las diferencias de color a lo largo de los ejes rojizo–verdoso y amarillento–azulado. Al trabajar en ambos sistemas a la vez, el método conserva el detalle fino de la foto original y, al mismo tiempo, captura diferencias de color más estables y cercanas a la percepción humana entre flores similares.

Figure 1
Figure 1.

Dos miradas paralelas a la misma flor

Para aprovechar al máximo estas visiones complementarias, los investigadores diseñan una red “de múltiples vías”: esencialmente dos carriles expertos que trabajan en paralelo. Un carril analiza la versión RGB de cada imagen y el otro estudia la versión LAB. Cada carril está compuesto por bloques convolucionales modernos, un tipo de estructura de aprendizaje profundo que sobresale en detectar bordes, texturas y formas. Las capas iniciales se fijan en los contornos de los pétalos y pequeños patrones de textura, mientras que las capas profundas resumen estructuras más amplias. En varias etapas, la red fusiona lo aprendido por cada carril apilando sus mapas de características. Así, el modelo pondera contornos nítidos del RGB frente a la estructura de color más suave y robusta a la iluminación del LAB, combinándolos en una representación interna más rica de cada flor.

Dejar que la atención encuentre los detalles decisivos

Tras destilar las imágenes en mapas de características compactos mediante los carriles paralelos, entra en juego un segundo tipo de modelo: un transformador visual. Los transformadores se inventaron originalmente para el lenguaje, donde sobresalen en identificar relaciones a larga distancia, y ahora desempeñan un papel creciente en el análisis de imágenes. Aquí, las características fusionadas del crisantemo se cortan en muchos pequeños parches y se introducen en el transformador, que usa un mecanismo de “atención” para decidir qué parches son los más relevantes para distinguir variedades. Esta visión global ayuda a la red a conectar diferencias cromáticas sutiles cerca de la base de los pétalos con patrones más externos en la cabeza floral, conduciendo a un juicio más fiable sobre el tipo y el origen de cada flor.

Poner el sistema a prueba

El equipo reunió un conjunto de imágenes considerable: más de 9.000 fotos de la parte trasera y delantera de flores de 18 tipos de crisantemo y 15 regiones de cultivo, con algunas variedades —como el crisantemo Hangbai— representadas en muchos lugares diferentes. Entrenaron y evaluaron su modelo con este conjunto de datos y lo compararon con arquitecturas de aprendizaje profundo bien conocidas y ampliamente usadas en reconocimiento de imágenes. Los resultados son llamativos: trabajando con imágenes de vista trasera, el nuevo método alcanzó una precisión de aproximadamente 96–97 % en su propio conjunto de crisantemos y más del 99 % en un referente público estándar de imágenes de flores. Superó a varios competidores fuertes, incluidos modelos puramente convolucionales y puramente transformadores, y mantuvo no solo alta precisión sino también un rendimiento estable a través de muchas categorías de crisantemo.

Figure 2
Figure 2.

Qué implica esto para los agricultores y la medicina herbal

En términos prácticos, el estudio muestra que un sistema de análisis de imágenes cuidadosamente diseñado puede igualar —y en algunos casos superar— la fiabilidad de enfoques de laboratorio más complejos para reconocer crisantemos medicinales. Al combinar dos maneras de representar el color con dos tipos complementarios de redes neuronales, el método puede detectar señales visuales finas que distinguen flores parecidas procedentes de distintas regiones. Esto podría facilitar controles de calidad rápidos en mercados, ayudar a rastrear el origen real de las cabezas florales secas y, en última instancia, extenderse a otras plantas medicinales que requieren identificación precisa de la variedad. A medida que estas herramientas salgan del laboratorio hacia dispositivos portátiles o máquinas clasificadoras, prometen poner el “ojo entrenado” del experto al alcance de donde se cultivan, comercian o prescriben plantas medicinales.

Cita: Jiang, J., Yang, X., Wang, T. et al. Chrysanthemum classification via color space fusion transformer. Sci Rep 16, 9397 (2026). https://doi.org/10.1038/s41598-026-40027-2

Palabras clave: clasificación de crisantemos, reconocimiento de imágenes de plantas, fusión de espacios de color, transformador visual, hierbas medicinales