Clear Sky Science · fr
Jeu de données multi-angle et multi-posture de tomates pour la phénotypage fin
Pourquoi les tomates et les caméras intelligentes comptent
Les tomates ne sont pas seulement un aliment de base des salades ; elles font partie des cultures les plus importantes au monde et sont un modèle central en science végétale. Les sélectionneurs et chercheurs examinent constamment les plants de tomate en détail — comment poussent les feuilles, quand les fleurs s’ouvrent, comment les fruits changent de couleur — afin de créer des variétés plus résistantes, plus goûteuses et plus robustes. Pourtant, cette inspection rapprochée se fait généralement à l’œil nu, ce qui est lent, difficile à reproduire et peut varier d’un observateur à l’autre. Cet article présente TomatoMAP, une vaste collection d’images de tomates conçue avec soin qui permet aux ordinateurs d’inspecter les plantes sous de nombreux angles, aidant à réduire l’incertitude humaine dans l’évaluation des plantes.

Une nouvelle bibliothèque d’images de la croissance de la tomate
TomatoMAP est un jeu de données d’images complet centré sur la tomate cultivée, Solanum lycopersicum. Il contient 68 080 photographies couleur couvrant la vie de 101 plants cultivés en serre sur plus de cinq mois. Plutôt que quelques clichés, chaque plant est photographié à de nombreuses reprises au fil de sa croissance, capturant des stades différents tels que la floraison et la maturation des fruits. Pour chaque image, des experts fournissent des annotations riches : des boîtes simples délimitant sept régions d’intérêt clés — feuilles, grappes florales, grappes de fruits, pousses, et plus — ainsi que des étiquettes de stade de croissance basées sur une échelle standardisée couramment utilisée par les agronomes. Dans un ensemble séparé d’images en gros plan, les bourgeons, fleurs et fruits individuels sont délimités jusqu’au niveau du pixel, permettant une analyse extrêmement fine.
Voir les plantes sous tous les angles
Pour collecter ce jeu de données, les chercheurs ont construit une station d’imagerie dédiée combinant une plateforme tournante et quatre caméras synchronisées. Les plants de tomate cultivés en conditions contrôlées de serre sont placés sur le plateau tournant, qui effectue des rotations par pas de 30 degrés pour faire un cercle complet. À chaque étape, des caméras placées à quatre hauteurs et angles prennent des photos en même temps, produisant une vue multi-angle d’une même posture du plant. Sur 163 jours, ce dispositif a produit plus de 64 000 images de résolution modérée pour la classification des stades de croissance et la détection d’organes, plus 3 616 gros plans en haute résolution pour une segmentation détaillée. Cette conception multi-vue conserve la structure tridimensionnelle — par exemple la manière dont les feuilles se chevauchent ou dont sont disposées les grappes de fleurs et de fruits — ce qui est difficile à capturer avec des images uniques et plates.
Apprendre aux ordinateurs à lire les caractères des plantes
TomatoMAP n’est pas qu’une galerie de photos ; c’est aussi un banc d’essai pour l’intelligence artificielle moderne. L’équipe a entraîné et évalué des modèles de vision par ordinateur légers et rapides, choisis pour leur usage potentiel en temps réel dans les serres. Un réseau compact de classification d’images a appris à attribuer des stades de croissance. Un modèle efficace de détection d’objets a appris à localiser des parties de la plante comme les feuilles, les grappes florales et les grappes de fruits dans chaque image. Pour les gros plans, un modèle de segmentation d’instances a tracé le contour précis des bourgeons, fleurs et fruits individuels, et distingué les stades précoces et tardifs de développement selon la taille et la couleur. Les auteurs montrent que ces modèles atteignent une grande précision, surtout pour les fleurs et fruits de plus grande taille, et peuvent s’exécuter assez rapidement pour être pratiques pour une surveillance continue.

Construire un flux de travail numérique étape par étape
Pour rendre le phénotypage automatisé plus fiable, les chercheurs ont conçu un flux de travail « en cascade » à trois niveaux. D’abord, les données sont organisées depuis les images globales du plant jusqu’aux segmentations détaillées. Ensuite, les modèles sont disposés en chaîne : un classificateur de stade de croissance oriente quels plants ou instants sont transmis à un détecteur, qui met ensuite en évidence les régions les plus pertinentes pour que le modèle de segmentation les affine. Enfin, les sorties de tous les modèles sont combinées en une description consolidée des caractères de chaque plant, comme le nombre de fruits présents et leurs stades. En structurant ainsi à la fois les données et les modèles, les erreurs sont moins susceptibles de s’amplifier, et chaque étape peut être améliorée ou remplacée sans reconstruire l’ensemble du système.
Quelle concordance entre machines et yeux humains
Parce que les experts humains ne sont pas toujours d’accord entre eux, l’équipe a soigneusement vérifié à quel point les modèles d’IA et les spécialistes s’alignent. Ils ont comparé des centaines d’images étiquetées indépendamment par cinq experts et par un modèle de détection entraîné. En utilisant une mesure standard d’accord, les comparaisons expert–expert et IA–expert ont montré une cohérence « presque parfaite ». Cela suggère que, du moins pour les structures et stades étudiés ici, les méthodes automatisées peuvent égaler la fiabilité d’observateurs humains formés tout en évitant la fatigue et l’incohérence.
Ce que cela signifie pour les cultures de demain
TomatoMAP démontre qu’avec un dispositif d’imagerie adapté et une annotation soignée, les ordinateurs peuvent suivre la croissance des tomates dans un grand niveau de détail depuis de nombreux angles, et le faire d’une manière qui reflète étroitement le jugement des experts. Pour les sélectionneurs et les agriculteurs, cela ouvre la porte à un criblage plus rapide et plus objectif de nouvelles variétés et conditions de culture, qu’il s’agisse d’évaluer la charge en fruits ou de repérer de subtiles différences d’architecture végétale. Bien que certains organes restent plus difficiles à capturer parfaitement et que des efforts supplémentaires soient nécessaires pour adapter les modèles à des dispositifs spécifiques, ce jeu de données pose les bases d’un phénotypage numérique évolutif et moins biaisé qui pourrait, à terme, aider à faire passer des cultures plus résilientes et productives des expérimentations en serre jusqu’à l’assiette.
Citation: Zhang, Y., Struckmeyer, S., Kolb, A. et al. Tomato Multi-Angle Multi-Pose Dataset for Fine-Grained Phenotyping. Sci Data 13, 309 (2026). https://doi.org/10.1038/s41597-026-06926-9
Mots-clés: phénotypage de la tomate, imagerie végétale, jeu de données multi-vues, vision par ordinateur en agriculture, amélioration des cultures