Clear Sky Science · it
Modello visione-linguaggio informato dal dominio per il trasporto merci sostenibile con classificazione del powertrain e del carico dei camion da drayage
Porti più puliti, camion più intelligenti
I porti movimentano le merci che riforniscono i nostri negozi, ma i camion per il trasporto a corto raggio che spostano i container dentro e fuori i terminal sono anche grandi fonti d’inquinamento. Questo studio mostra come un nuovo tipo di intelligenza artificiale possa osservare questi camion da drayage con telecamere stradali e determinare automaticamente quali continuano a bruciare diesel e quali usano tecnologie più pulite—senza alcuna etichettatura manuale delle immagini. Un tale livello di informazione automatizzata potrebbe aiutare regolatori, pianificatori e comunità locali a monitorare i progressi verso un’aria più pulita intorno ad alcuni dei porti più trafficati del mondo.
Perché i camion portuali contano per il clima e la salute
Negli Stati Uniti, i trasporti sono la singola fonte più grande di emissioni di gas serra, e i camion pesanti contribuiscono molto più di quanto suggerisca la loro quota di veicoli: rappresentano una piccola parte dei veicoli ma una grande parte delle emissioni. Questo è particolarmente evidente intorno ai porti di Los Angeles e Long Beach, una coppia di porti vicini che insieme gestiscono circa il 40 percento delle importazioni di container statunitensi e sono anche la più grande fonte fissa di inquinamento atmosferico della California meridionale. I camion da drayage—i mezzi che trasportano i container tra porti, scali ferroviari e magazzini—generano gran parte di questo inquinamento nonostante percorrano tratte relativamente brevi e prevedibili. Per questo la California ha stabilito che entro il 2035 tutti i camion da drayage portuali devono essere a emissioni zero, affidandosi a soluzioni elettriche a batteria, fuel cell a idrogeno o tecnologie a gas più pulite al posto del diesel convenzionale.

Capire cosa alimenta un camion e cosa trasporta
Per sapere se queste politiche stanno funzionando, i responsabili devono misurare che tipo di camion effettivamente si presentano ai cancelli portuali e sulle autostrade: sono diesel o elettrici? Trasportano un container pieno, un telaio vuoto o nessun rimorchio? Tradizionalmente, rispondere a tali domande richiede la creazione di grandi raccolte di immagini etichettate a mano e l’addestramento di modelli specifici per ciascun compito. Gli autori propongono una strada diversa, chiamata ZeroDray, che utilizza un modello visione-linguaggio—un sistema AI in grado di comprendere sia immagini che testo—senza alcun addestramento aggiuntivo. Al modello vengono fornite immagini da telecamere stradali di camion in transito lungo un corridoio che serve i porti di Los Angeles e Long Beach e gli si chiede di classificare sia il powertrain (diesel, elettrico, gas naturale compresso o idrogeno) sia la configurazione del carico (singolo container da 20 piedi, equivalente più lungo da 40 piedi, chassis vuoto o camion bobtail senza rimorchio).
Insegnare all’AI a ragionare come un esperto di camion
Così come sono, i modelli visione-linguaggio sono generalisti: sanno un po’ di tutto preso da internet ma mancano di conoscenze profonde su argomenti di nicchia come il drayage. ZeroDray colma questa lacuna alimentando il modello con prompt attentamente costruiti che codificano suggerimenti da esperti. Per i powertrain, i prompt descrivono indizi visivi come i collettori di scarico e i grandi serbatoi del carburante per il diesel, i serbatoi cilindrici per il CNG, i serbatoi per l’idrogeno nei veicoli a fuel cell, o l’assenza di componenti di scarico e distintivi EV nei mezzi elettrici. Per il carico, i prompt invitano il modello a ragionare sulla geometria della scena: la lunghezza del container supera visibilmente l’altezza e la lunghezza della cabina, come in un carico lungo da 40 piedi, oppure è più vicina nelle dimensioni, come in un container più corto da 20 piedi? Chiedendo all’AI di seguire questi indizi passo dopo passo e di spiegare il proprio ragionamento in linguaggio semplice, il framework rende le decisioni più trasparenti e più facili da verificare.

Mettere il sistema alla prova sul traffico portuale reale
I ricercatori hanno valutato ZeroDray su 443 immagini di camion catturate in due giorni di febbraio 2025 da una telecamera fissa a bordo strada vicino ai porti. Osservatori umani hanno fornito le etichette di verità a terra per il powertrain e la configurazione del carico di ciascun camion. Hanno quindi confrontato ZeroDray con una configurazione più semplice che forniva solo nomi di classe essenziali allo stesso modello sottostante. Con una guida minima, il sistema di base riconosceva già alcuni casi ovvi, come i camion diesel senza rimorchio. Ma faticava molto quando le distinzioni dipendevano da piccole differenze visive o dalla disposizione spaziale, confondendo spesso trattori diesel ed elettrici o scambiando container corti e lunghi. Una volta aggiunti gli indizi visivi informati dagli esperti e le regole spaziali, l’accuratezza è aumentata drasticamente. La classificazione del powertrain ha raggiunto circa il 100 percento per diesel, elettrico, idrogeno e CNG. Il riconoscimento del carico, in particolare la difficile distinzione tra lunghezze equivalenti singole e doppie dei container, è passato da circa la metà delle risposte corrette a circa il 98 percento. Complessivamente, sulle 11 categorie combinate powertrain-carico, il framework ZeroDray migliorato ha ottenuto un punteggio F1 medio del 99 percento, superando di gran lunga l’approccio di base.
Cosa significa per corridoi merci più puliti
Per i non specialisti, il punto chiave è che un’AI generalista, quando guidata con gli opportuni suggerimenti esperti, può «guardare» i video autostradali e dire in modo affidabile non solo come sono caricati i camion ma anche cosa li alimenta—senza costosi addestramenti personalizzati. Questa capacità potrebbe fornire alle autorità portuali e ai regolatori un nuovo strumento potente per monitorare il passaggio dal diesel ai camion da drayage a emissioni zero, individuare dove sono più necessari nuovi punti di ricarica o stazioni per l’idrogeno e ridurre i viaggi a vuoto. Pur avendo usato un dataset modesto proveniente da una singola telecamera in condizioni ideali, gli autori sostengono che la stessa strategia può essere estesa ad altri hub merci e ambienti più vari. Se ampliati in modo responsabile, sistemi come ZeroDray potrebbero rendere visibili i dettagli altrimenti invisibili dell’attività di trasporto merci, aiutando comunità e decisori a spingere i corridoi merci verso operazioni più pulite ed efficienti.
Citazione: Feng, G., Li, Y., Tok, A.Y.C. et al. Domain informed vision language model for sustainable freight with drayage truck powertrain and cargo classification. npj. Sustain. Mobil. Transp. 3, 15 (2026). https://doi.org/10.1038/s44333-026-00086-4
Parole chiave: camion a emissioni zero, modelli visione-linguaggio, drayage portuale, emissioni del trasporto merci, trasporto sostenibile