Clear Sky Science · es
Conjunto de Datos Multi-Ángulo y Multi-Poses de Tomate para Fenotipado de Alta Resolución
Por qué importan los tomates y las cámaras inteligentes
Los tomates no son solo un básico de la ensalada; son uno de los cultivos más importantes del mundo y una pieza clave en la investigación vegetal. Mejoradores e investigadores examinan continuamente las plantas de tomate en detalle—cómo crecen las hojas, cuándo se abren las flores, cómo cambian de color los frutos—para crear variedades más resistentes, sabrosas y productivas. Sin embargo, esta inspección cercana suele hacerse a simple vista, lo que es lento, difícil de reproducir y puede variar entre observadores. Este artículo presenta TomatoMAP, una colección grande y cuidadosamente diseñada de imágenes de tomate que permite a los ordenadores inspeccionar plantas desde múltiples ángulos, ayudando a reducir la incertidumbre humana en la evaluación vegetal.

Una nueva biblioteca de imágenes del crecimiento del tomate
TomatoMAP es un conjunto de datos de imágenes exhaustivo centrado en el tomate cultivado, Solanum lycopersicum. Contiene 68.080 fotografías en color que cubren la vida de 101 plantas cultivadas en invernadero durante más de cinco meses. En lugar de unas pocas instantáneas, cada planta se fotografía de forma recurrente a medida que crece, capturando etapas como la floración y la maduración del fruto. Para cada imagen, los expertos ofrecen etiquetas detalladas: cuadros simples que marcan siete regiones clave de interés—hojas, racimos de flores, racimos de frutos, brotes y más—y etiquetas de estadio de crecimiento basadas en una escala estandarizada de uso común en agronomía. En un conjunto separado de imágenes de alto acercamiento, botones, flores y frutos individuales están delineados hasta el nivel de píxel, lo que permite un análisis extremadamente fino.
Ver las plantas desde todos los lados
Para recopilar este conjunto de datos, los investigadores construyeron una estación de imagen dedicada que combina una plataforma giratoria con cuatro cámaras sincronizadas. Las plantas de tomate cultivadas en condiciones controladas de invernadero se colocan sobre la mesa giratoria, que rota en pasos de 30 grados para completar un círculo. En cada paso, cámaras situadas a cuatro alturas y ángulos capturan imágenes simultáneamente, produciendo una vista multi-ángulo de la misma pose de la planta. A lo largo de 163 días, este montaje generó más de 64.000 imágenes de resolución moderada para clasificación del estadio de crecimiento y detección de órganos, además de 3.616 primeros planos en alta resolución para segmentación detallada. Este diseño multivista preserva la estructura tridimensional—por ejemplo, cómo se solapan las hojas o cómo se disponen los racimos de flores y frutos—algo difícil de capturar con imágenes planas y únicas.
Enseñar a los ordenadores a leer rasgos vegetales
TomatoMAP no es solo una galería fotográfica; también es un banco de pruebas para la inteligencia artificial moderna. El equipo entrenó y evaluó modelos de visión por computador ligeros y rápidos elegidos por su potencial uso en tiempo real en invernaderos. Una red compacta de clasificación de imágenes aprendió a asignar los estadios de crecimiento de las plantas. Un modelo eficiente de detección de objetos aprendió a localizar partes de la planta como hojas, racimos de flores y racimos de frutos en cada fotograma. Para las imágenes de primer plano, un modelo de segmentación por instancias trazó el contorno preciso de botones, flores y frutos individuales, y distinguió entre etapas tempranas y tardías de desarrollo en función del tamaño y el color. Los autores muestran que estos modelos alcanzan alta precisión, especialmente para flores y frutos de mayor tamaño, y pueden ejecutarse lo suficientemente rápido como para ser prácticos en monitorización continua.

Construir un flujo de trabajo digital paso a paso
Para hacer el fenotipado automatizado más fiable, los investigadores diseñaron un flujo de trabajo “en cascada” de tres niveles. Primero, los datos se organizan desde imágenes sencillas de la planta completa hasta segmentaciones detalladas. Segundo, los modelos se disponen en cadena: un clasificador de estadio de crecimiento decide qué plantas o puntos temporales se remiten a un detector, que a su vez resalta las regiones más relevantes para que el modelo de segmentación las refine. Finalmente, las salidas de todos los modelos se combinan en una descripción consolidada de los rasgos de cada planta, como cuántos frutos hay y en qué estadios se encuentran. Al estructurar así tanto los datos como los modelos, es menos probable que los errores se propaguen en cascada, y cada paso puede mejorarse o reemplazarse sin reconstruir todo el sistema.
Qué tan bien se parecen las máquinas a la vista humana
Dado que los expertos humanos no siempre coinciden entre sí, el equipo comprobó cuidadosamente hasta qué punto los modelos de IA y los especialistas se alinean. Compararon cientos de imágenes etiquetadas de forma independiente por cinco expertos y por un modelo de detección entrenado. Usando una medida estándar de acuerdo, tanto las comparaciones experto–experto como IA–experto mostraron una consistencia “casi perfecta”. Esto sugiere que, al menos para las estructuras y estadios estudiados, los métodos automatizados pueden igualar la fiabilidad de observadores humanos entrenados mientras evitan la fatiga y la falta de consistencia.
Qué implica esto para los cultivos del futuro
TomatoMAP demuestra que con el montaje de imagen adecuado y una anotación cuidadosa, los ordenadores pueden seguir el crecimiento del tomate con gran detalle desde múltiples ángulos y hacerlo de una manera que refleja estrechamente el juicio de expertos. Para mejoradores y agricultores, esto abre la puerta a una evaluación más rápida y objetiva de nuevas variedades y condiciones de cultivo, desde estimar la carga de frutos hasta detectar diferencias sutiles en la arquitectura de la planta. Aunque algunos órganos vegetales siguen siendo más difíciles de capturar a la perfección y se necesita más trabajo para adaptar los modelos a dispositivos concretos, este conjunto de datos sienta las bases para un fenotipado digital escalable y menos sesgado que podría, en última instancia, ayudar a trasladar cultivos más resistentes y productivos desde experimentos en invernadero hasta la mesa.
Cita: Zhang, Y., Struckmeyer, S., Kolb, A. et al. Tomato Multi-Angle Multi-Pose Dataset for Fine-Grained Phenotyping. Sci Data 13, 309 (2026). https://doi.org/10.1038/s41597-026-06926-9
Palabras clave: fenotipado de tomate, imágenes de plantas, conjunto de datos multivista, visión por computador en agricultura, mejora de cultivos