Clear Sky Science · sv

Domäninformerad vision‑språkmodell för hållbart godstransport med klassificering av drayage‑lastbilars drivlina och last

2026-03-02 · Tillbaka till index

Renare hamnar, smartare lastbilar

Hamnar flyttar varor som fyller våra butiker, men de kortdistanslastbilar som kör containrar in och ut ur terminaler är också stora förorenare. Denna studie visar hur en ny sorts artificiell intelligens kan övervaka dessa ”drayage”‑lastbilar med vägkameror och automatiskt avgöra vilka som fortfarande använder diesel och vilka som kör renare tekniker—utan någon manuell bildmärkning. Denna typ av automatiserad insikt kan hjälpa tillsynsmyndigheter, planerare och lokala samhällen att följa utvecklingen mot renare luft kring några av världens mest trafikerade hamnar.

Varför hamnlastbilar spelar roll för klimat och hälsa

I USA är transportsektorn den största enskilda källan till växthusgasutsläpp, och tunga lastbilar står för en oproportionerligt stor del: de utgör en liten andel av fordonen men en stor andel av utsläppen. Detta syns särskilt tydligt kring hamnarna i Los Angeles och Long Beach, två grannhamnar som tillsammans hanterar ungefär 40 procent av USA:s containerimport och samtidigt är södra Kaliforniens största fasta källa till luftföroreningar. Drayage‑lastbilar—fordonen som kör containrar mellan hamnar, godsbangårdar och lager—genererar mycket av denna förorening trots att de kör relativt korta och förutsägbara rutter. Kalifornien har därför beslutat att alla hamndrayage‑lastbilar ska vara nollutsläppsfordon senast 2035, och förlita sig på batterielektriska fordon, bränsleceller för väte eller renare gaskomponenter istället för konventionell diesel.

Se vad som driver en lastbil och vad den transporterar

För att veta om dessa policyer fungerar behöver tjänstemän mäta vilka typer av lastbilar som faktiskt dyker upp vid hamnportar och på motorvägar: är de diesel eller elektriska? Dra de en full container, ett tomt ramverk eller ingen trailer alls? Traditionellt kräver sådana frågor stora, handmärkta bildsamlingar och upptränade uppgiftsspecifika modeller. Författarna föreslår en annan väg, kallad ZeroDray, som använder en vision‑språkmodell—ett AI‑system som kan förstå både bilder och text—utan någon ytterligare träning. Modellen får vägkamerabilder av passerande lastbilar längs en korridor som betjänar Los Angeles och Long Beach och ska klassificera både drivlinan (diesel, el, komprimerad naturgas eller väte) och lastuppsättningen (enkel 20‑fot container, längre 40‑fot ekvivalent, tomt chassi eller bobtail‑lastbil utan trailer).

Lära AI att tänka som en lastbilexpert

Ut ur boxen är vision‑språkmodeller generalister: de vet lite om allt från internet men saknar djup kunskap om nischämnen som drayage‑trafik. ZeroDray överbryggar den luckan genom att mata modellen med noggrant utformade promptar som kodar in expertledtrådar. För drivlinor beskriver promptarna visuella tecken som avgassvampar och stora bränsletankar för diesel, cylindertankar för CNG, vätetankar för bränslecellfordon eller frånvaro av avgassystem och EV‑märkning för elektriska dragbilar. För last uppmanas modellen att resonera om scenens geometri: överstiger containerlängden märkbart dess höjd och hyttens längd, som vid en lång 40‑fot last, eller ligger den närmare i storlek som en kortare 20‑fot container? Genom att be AI att gå igenom dessa ledtrådar steg för steg och förklara sitt resonemang i klartext gör ramverket besluten mer genomskinliga och lättare att granska.

Sätta systemet på prov i verklig hamntrafik

Forskarna utvärderade ZeroDray på 443 lastbilsbilder fångade under två dagar i februari 2025 av en fast vägkamera nära hamnarna. Människliga observatörer gav sanna etiketter för varje lastbils drivlina och lastkonfiguration. De jämförde sedan ZeroDray med en enklare inställning som bara gav blotta klassnamn till samma underliggande modell. Med minimal vägledning kände det grundläggande systemet redan igen några raka fall, som dieseldragbilar utan trailer. Men det hade stora svårigheter när skillnader berodde på små visuella detaljer eller på rumslig layout, och förväxlade ofta diesel‑ och elektriska dragbilar eller blandade ihop korta och långa containrar. När de expertinformerade visuella ledtrådarna och de rumsliga reglerna lades till, ökade noggrannheten dramatiskt. Klassificeringen av drivlinor nådde omkring 100 procent för diesel, el, väte och CNG. Godskategorisering, särskilt den knepiga skillnaden mellan enkel och dubbel ekvivalent containerlängd, förbättrades från omkring hälften rätt till ungefär 98 procent. Sammanlagt, över alla 11 kombinerade drivlina‑ och lastkategorier, uppnådde det förbättrade ZeroDray‑ramverket ett genomsnittligt F1‑värde på 99 procent, långt över den enkla metoden.

Vad detta innebär för renare godskorridorer

För icke‑specialister är huvudslutsatsen att en allmän AI, när den styrs med rätt expertledtrådar, pålitligt kan ”titta” på vägvideo och avgöra inte bara hur lastbilar lastas utan också vad som driver dem—utan dyr specialanpassad träning. Denna förmåga kan ge hamnmyndigheter och tillsynsmyndigheter ett kraftfullt nytt verktyg för att övervaka övergången från diesel till nollutsläpps‑drayage, identifiera var nya ladd‑ eller vätstationer behövs mest och minska onödiga tomkörningar. Även om den aktuella studien använde en modest datamängd från en enda kamera under gynnsamma förhållanden, menar författarna att samma strategi kan utvidgas till andra godsnav och mer varierade miljöer. Om den skalas upp ansvarsfullt kan system som ZeroDray göra godsrörelsers osynliga detaljer synliga, och hjälpa samhällen och beslutsfattare att styra godskorridorer mot renare och mer effektiva operationer.

Citering: Feng, G., Li, Y., Tok, A.Y.C. et al. Domain informed vision language model for sustainable freight with drayage truck powertrain and cargo classification. npj. Sustain. Mobil. Transp. 3, 15 (2026). https://doi.org/10.1038/s44333-026-00086-4

Nyckelord: nollutsläpps‑lastbilar, vision‑språkmodeller, hamndrivage, godsemissioner, hållbara transporter