Clear Sky Science · sv

En enhetlig EfficientSwinB-baserad ram för igenkänning av medicinalväxter och klassificering av safflor-germplasm

· Tillbaka till index

Varför smartare växtidentifiering spelar roll

Från köksörter till traditionella läkemedel ser många av de växter som stödjer vår hälsa förvånansvärt lika ut. Att skilja dem åt med blotta ögat kräver år av träning, och misstag kan påverka läkemedelskvalitet, odlingsbeslut och insatser för att skydda biologisk mångfald. I den här studien presenteras ett nytt ramverk inom artificiell intelligens (AI) som kan känna igen medicinalväxter från vardagsfoton och till och med skilja mycket nära besläktade safflorsorter åt utifrån deras blad. Genom att göra växtidentifiering snabbare och mer pålitlig pekar arbetet mot praktiska verktyg för apotekare, jordbrukare och bevarandeförespråkare.

Figure 1
Figure 1.

Från bladfoton till tillförlitliga svar

Författarna koncentrerar sig på en av de svåraste varianterna av växtigenkänning: att arbeta direkt från bladbilder. Utomhusbilder av medicinalväxter är ofta röriga med jord, skuggor och andra växter, samtidigt som många arter delar nästan identiska former och kärlmönster. Traditionella metoder inom datorseende krävde stora, noggrant kurerade datamängder och hade ändå svårt att hantera sådan variation. Här bygger forskarna vidare på en modern familj av AI-modeller kallade vision transformers, som behandlar en bild som en samling små patchar och lär sig hur dessa delar relaterar till varandra. Målet är att utforma ett enda ramverk som klarar både bred artigenkänning i fält och fina skillnader mellan grödsorter i laboratoriet.

En slankare, skarpare blick för medicinalväxter

För generell igenkänning av medicinalväxter föreslår teamet en modell de kallar EfficientSwinB-SE. Den utgår från Swin Transformer, en populär vision transformer som betraktar överlappande fönster i en bild för att fånga både lokala detaljer och den större scenen. Den första förbättringen är ett beskärningssteg: modellen tar automatiskt bort de minst användbara kopplingarna i sitt tidiga bildbehandlingslager, vilket minskar beräkningarna utan att förändra den övergripande strukturen. Den andra förbättringen är ett squeeze-and-excitation-block, som lär modellen att väga vissa visuella kanaler tyngre än andra, ungefär som en botaniker som fäster särskild uppmärksamhet vid kärlstruktur eller kanttextur samtidigt som störande bakgrundspixlar ignoreras.

Zooma in på skillnader inom safflorfamiljen

Att känna igen sorter inom en enda gröda är ännu svårare än att skilja olika arter åt, eftersom de visuella skillnaderna kan vara extremt subtila. För att hantera detta utökar författarna sitt ramverk till en andra modell kallad OLSF-EfficientSwinB-SE, anpassad för safflor-germplasm—de genetiska linjer som används i förädling. I laboratoriemiljö förstärker de bladbilderna med en process kallad "Optimal Leaf Structure Feature" som framhäver kärlriktningar och fin textur. Dessa förbättrade bilder matas sedan in i samma beskurna och uppmärksammade transformer-backbone. Denna kombination hjälper AI:n att fokusera på små, men biologiskt meningsfulla, strukturella ledtrådar som skiljer en safflorlinje från en annan, vilket stödjer mer precis förädling och hantering av genetiska resurser.

Figure 2
Figure 2.

Sätta det nya ramverket på prov

Forskarna utvärderar sina modeller på tre publika datamängder: indiska medicinalväxter fotograferade i trädgårdar, indonesiska medicinalväxter hämtade från olika onlinekällor, och en safflor-datamängd som innehåller dussintals sorter avbildade under kontrollerade laboratorieförhållanden. Överlag presterar EfficientSwinB-SE bättre än välkända djuplärandemodeller, inklusive klassiska konvolutionsnät och andra transformers. Den når cirka 99,75 % noggrannhet på den indiska datamängden och 97,70 % på den indonesiska, även under varierande ljusförhållanden och röriga bakgrunder. För den finförgrenade saffloruppgiften når OLSF-EfficientSwinB-SE-varianten omkring 91,63 % noggrannhet och överträffar en tidigare transformer-baserad metod som designats särskilt för denna gröda.

Vad detta betyder för växtanvändning i verkligheten

I vardagstermer visar studien att det är möjligt att bygga ett enda, effektivt AI-"öga" som både kan känna igen ett brett spektrum av medicinalväxter i fält och pålitligt sortera nästan identiska blad i laboratoriet. Genom att strimla bort onödiga beräkningar och lära modellen att betona de mest informativa visuella ledtrådarna skapar författarna verktyg som är precisa, robusta och praktiska nog för nära realtidsanvändning. Sådana system kan ligga till grund för mobilappar för örtidentifiering, automatiserad katalogisering av genetiska resurser och intelligenta jordbruksplattformar som spårar grödor via deras blad. När samma idéer tillämpas på fler arter och miljöer kan de bidra till att förena traditionell växtkunskap och modern datadriven jordbruksvetenskap.

Citering: Khuat, P.T., Thien Van, H. A unified EfficientSwinB-based framework for medicinal plant recognition and safflower germplasm classification. Sci Rep 16, 11791 (2026). https://doi.org/10.1038/s41598-026-42449-4

Nyckelord: igenkänning av medicinalväxter, djuplärande, vision transformer, safflor-germplasm, växtidentifiering