Clear Sky Science · sv

Tomat: dataset med flera vinklar och poser för finfördelad fenotypning

· Tillbaka till index

Varför tomater och smarta kameror spelar roll

Tomater är inte bara en vanlig salladsingrediens; de är en av världens viktigaste grödor och ett arbetsdjur inom växtvetenskapen. Förädlare och forskare granskar ständigt tomatplantor i detalj—hur blad växer, när blommor slår ut, hur frukter förändrar färg—för att ta fram tuffare, smakligare och mer motståndskraftiga sorter. Denna noggranna inspektion görs ofta med blotta ögat, vilket är långsamt, svårt att upprepa och kan variera mellan observatörer. Denna artikel presenterar TomatoMAP, en stor, omsorgsfullt designad samling tomatbilder som låter datorer undersöka plantor från många vinklar och därigenom minska mänsklig osäkerhet vid bedömning.

Figure 1
Figure 1.

En ny bildbank över tomattillväxt

TomatoMAP är ett omfattande bilddataset med fokus på odlade tomaten, Solanum lycopersicum. Det innehåller 68 080 färgfotografier som täcker livet för 101 växthusodlade plantor över mer än fem månader. Istället för enstaka ögonblicksbilder fotograferas varje planta om och om igen under tillväxten, vilket fångar olika stadier som blomning och fruktmognad. För varje bild tillhandahåller experter rika etiketter: enkla rutor som markerar sju centrala intresseområden—blad, blomställningar, fruktklasar, skott med mera—samt tillväxtstegsetiketter baserade på en standardiserad skala som agronomer ofta använder. I en separat uppsättning närbilder är enskilda knappar, blommor och frukter utskrivna ända ner på pixelnivå, vilket möjliggör mycket finfördelad analys.

Att se växter från alla sidor

För att samla in detta dataset byggde forskarna en specialiserad bildstation som kombinerar en roterande plattform med fyra synkroniserade kameror. Tomatplantor odlade under kontrollerade växthusförhållanden placeras på vridbordet, som roterar i steg om 30 grader för att fullborda en hel cirkel. Vid varje steg fångar kameror placerade på fyra höjder och vinklar bilder samtidigt, vilket ger flera vinklar av samma plantpose. Under 163 dagar producerade denna uppställning mer än 64 000 bilder i måttlig upplösning för klassificering av tillväxtstadier och organsdetektion, plus 3 616 högupplösta närbilder för detaljerad segmentering. Denna design med flera vyer bevarar tredimensionell struktur—som hur blad överlappar eller hur kluster av blommor och frukter är ordnade—vilket är svårt att fånga med enstaka, platta bilder.

Att lära datorer läsa växtegenskaper

TomatoMAP är inte bara ett fotogalleri; det är också en testbädd för modern artificiell intelligens. Teamet tränade och utvärderade lätta, snabba datorseendemodeller valda för potentiell realtidsanvändning i växthus. Ett kompakt bildklassificeringsnätverk lärde sig att tilldela växtens tillväxtstadier. En effektiv objektidentifieringsmodell lärde sig att lokalisera växtdelar som blad, blomställningar och fruktklasar i varje bildruta. För närbilderna spårade en instanssegmenteringsmodell den precisa konturen för enskilda knoppar, blommor och frukter, och skilde mellan tidiga och sena utvecklingsstadier baserat på storlek och färg. Författarna visar att dessa modeller når hög noggrannhet, särskilt för större blommor och frukter, och kan köras tillräckligt snabbt för att vara praktiska för kontinuerlig övervakning.

Figure 2
Figure 2.

Att bygga ett steg-för-steg digitalt arbetsflöde

För att göra automatiserad fenotypning mer robust designade forskarna ett trestegs "kaskad"-arbetsflöde. För det första organiseras data från enkla helplantbilder till detaljerade segmenteringar. För det andra är modellerna ordnade i en kedja: en tillväxtstadieklassificerare styr vilka plantor eller tidpunkter som skickas vidare till en detektor, som sedan markerar de mest relevanta regionerna för segmenteringsmodellen att förfina. Slutligen kombineras alla modellutgångar till en sammanställd beskrivning av varje plantas egenskaper, såsom hur många frukter som finns och vilka stadier de befinner sig i. Genom att strukturera både data och modeller på detta sätt minskar risken att fel snöbollar, och varje steg kan förbättras eller bytas ut utan att bygga om hela systemet.

Hur väl maskiner matchar mänskliga ögon

Eftersom mänskliga experter inte alltid är överens kontrollerade teamet noggrant hur väl AI-modeller och specialister stämmer överens. De jämförde hundratals bilder som etiketterats oberoende av fem experter och av en tränad detektionsmodell. Med en standardiserad överensstämmelsemått visade både expert–expert- och AI–expert-jämförelser "nästan perfekt" konsistens. Detta tyder på att, åtminstone för de strukturer och stadier som studerats här, kan de automatiserade metoderna uppnå samma pålitlighet som tränade mänskliga observatörer samtidigt som de undviker trötthet och inkonsekvens.

Vad detta innebär för framtida grödor

TomatoMAP visar att med rätt bilduppställning och noggrann annotering kan datorer spåra tomattillväxt i rik detalj från många vinklar och göra det på ett sätt som nära speglar expertbedömning. För växtförädlare och odlare öppnar detta dörren för snabbare, mer objektiv sortering av nya varianter och odlingsförhållanden, från bedömning av fruktmängd till att upptäcka subtila skillnader i växtarkitektur. Även om vissa växtorgan fortfarande är svårare att fånga perfekt och mer arbete krävs för att anpassa modeller till specifika enheter, lägger detta dataset en grund för skalbar, biasreducerande digital fenotypning som så småningom kan hjälpa till att föra mer motståndskraftiga och produktiva grödor från växthusexperiment till middagsbordet.

Citering: Zhang, Y., Struckmeyer, S., Kolb, A. et al. Tomato Multi-Angle Multi-Pose Dataset for Fine-Grained Phenotyping. Sci Data 13, 309 (2026). https://doi.org/10.1038/s41597-026-06926-9

Nyckelord: tomatfenotypning, växtavbildning, dataset med flera vyer, datorseende inom jordbruket, växtförädling