Clear Sky Science · de

Domäneninformiertes Vision‑Language‑Modell für nachhaltige Fracht mit Drayage‑Lkw‑Antrieben und Ladungsklassifikation

2026-03-02 · Zurück zur Übersicht

Sauberere Häfen, intelligentere Lkw

Häfen bewegen die Waren, die unsere Regale bestücken, doch die Kurzstrecken‑Lkw, die Container in und aus Terminals transportieren, sind auch bedeutende Verschmutzer. Diese Studie zeigt, wie eine neue Form künstlicher Intelligenz diese «Drayage»‑Lkw mit Straßenrandkameras überwachen und automatisch erkennen kann, welche noch Diesel verbrennen und welche sauberere Technologien nutzen – ganz ohne manuelle Bildbeschriftung. Solche automatischen Einsichten könnten Behörden, Planern und Anwohnern helfen, den Fortschritt zu sauberer Luft rund um einige der verkehrsreichsten Häfen der Welt zu verfolgen.

Warum Hafen‑Lkw für Klima und Gesundheit wichtig sind

In den Vereinigten Staaten ist der Verkehr die größte einzelne Quelle von Treibhausgasemissionen, und schwere Lkw schlagen deutlich über ihrem Anteil zu Buche: Sie machen nur einen kleinen Teil der Fahrzeuge aus, sind aber für einen großen Teil der Emissionen verantwortlich. Nirgendwo ist das deutlicher zu sehen als rund um die Häfen von Los Angeles und Long Beach, ein benachbartes Hafenpaar, das zusammen etwa 40 Prozent der US‑Containerimporte abwickelt und zugleich die größte stationäre Quelle luftgetragener Verschmutzung in Südkalifornien ist. Drayage‑Lkw – die Zugmaschinen, die Container zwischen Häfen, Rangierbahnhöfen und Lagern transportieren – erzeugen einen erheblichen Teil dieser Verschmutzung, obwohl sie vergleichsweise kurze, vorhersehbare Strecken zurücklegen. Kalifornien hat daher angeordnet, dass bis 2035 alle Hafen‑Drayage‑Lkw emissionsfrei sein müssen, also auf batterieelektrische, Brennstoffzellen‑Wasserstoff‑ oder sauberere Gas‑Technologien statt auf konventionellen Diesel setzen.

Erkennen, was einen Lkw antreibt und was er transportiert

Um zu wissen, ob diese Regelungen wirken, müssen Behörden messen, welche Arten von Lkw tatsächlich an Toren und auf Autobahnen auftauchen: Sind sie Diesel oder elektrisch? Ziehen sie einen vollen Container, ein leeres Fahrgestell oder überhaupt keinen Anhänger? Traditionell erfordert das Erkennen solcher Fragen große, manuell beschriftete Bildsammlungen und aufgabenspezifische Modelle. Die Autoren schlagen einen anderen Weg vor, genannt ZeroDray, der ein Vision‑Language‑Modell – ein KI‑System, das sowohl Bilder als auch Text verstehen kann – ohne zusätzliche Trainingsschritte nutzt. Dem Modell werden Straßenbildaufnahmen vorbeifahrender Lkw entlang eines Korridors zu den Häfen von Los Angeles und Long Beach vorgelegt, und es soll sowohl den Antrieb (Diesel, elektrisch, komprimiertes Erdgas oder Wasserstoff) als auch die Ladungskonfiguration (einzelner 20‑Fuß‑Container, längeres 40‑Fuß‑Äquivalent, leeres Chassis oder Bobtail‑Lkw ohne Anhänger) klassifizieren.

Der KI beibringen, wie ein Lkw‑Experte zu denken

Out of the box sind Vision‑Language‑Modelle Generalisten: Sie wissen ein bisschen über alles aus dem Internet, aber ihnen fehlt tiefes Wissen über Nischenthemen wie Drayage‑Trucking. ZeroDray überbrückt diese Lücke, indem es dem Modell sorgfältig formulierte Prompts zuführt, die Expertenhinweise kodieren. Für Antriebe beschreiben die Prompts visuelle Hinweise wie Auspuffstutzen und große Kraftstofftanks bei Diesel, Zylinderbehälter bei CNG, Wasserstofftanks bei Brennstoffzellen‑Lkw oder das Fehlen von Auspuffbauteilen und EV‑Emblemen bei elektrischen Fahrzeugen. Für die Ladung fordern die Prompts das Modell auf, über die Geometrie der Szene nachzudenken: Überragt die Länge des Containers seine Höhe und die Kabinenlänge deutlich, wie bei einer langen 40‑Fuß‑Fracht, oder ist sie näher dran, wie bei einem kürzeren 20‑Fuß‑Container? Indem die KI gebeten wird, diese Hinweise Schritt für Schritt zu durchdenken und ihre Schlussfolgerung in klarer Sprache zu erklären, macht das Framework seine Entscheidungen transparenter und leichter überprüfbar.

Das System im Echtverkehrstest an Hafenverkehr

Die Forschenden evaluierten ZeroDray an 443 Lkw‑Bildern, die an zwei Tagen im Februar 2025 von einer festen Straßenrandkamera in der Nähe der Häfen aufgenommen wurden. Menschliche Beobachter lieferten die Ground‑Truth‑Labels für Antrieb und Ladungskonfiguration jedes Fahrzeugs. Anschließend verglichen sie ZeroDray mit einer einfacheren Konfiguration, die dem gleichen Basis‑Modell nur rudimentäre Klassennamen vorgab. Mit minimaler Anleitung erkannte das einfache System bereits einige unkomplizierte Fälle, etwa Diesel‑Lkw ohne Anhänger. Es tat sich jedoch schwer, wenn Unterschiede von kleinen visuellen Merkmalen oder von der räumlichen Anordnung abhingen, verwechselte beispielsweise häufig Diesel‑ und Elektro‑Zugmaschinen oder kurze und lange Container. Sobald die fachkundigen visuellen Hinweise und räumlichen Regeln hinzugefügt wurden, stieg die Genauigkeit dramatisch. Die Antriebsklassifikation erreichte für Diesel, elektrisch, Wasserstoff und CNG etwa 100 Prozent. Die Ladungserkennung, insbesondere die schwierige Unterscheidung zwischen Einzel‑ und Doppel‑Äquivalent‑Containerlängen, verbesserte sich von etwa der Hälfte korrekter Zuordnungen auf rund 98 Prozent. Insgesamt erzielte das erweiterte ZeroDray‑Framework über alle 11 kombinierten Antriebs‑ und Ladungskategorien hinweg eine durchschnittliche F1‑Score von 99 Prozent und lag damit weit vor dem einfachen Ansatz.

Was das für sauberere Frachtkorridore bedeutet

Für Nicht‑Spezialisten ist die Kernbotschaft: Eine allgemeine KI kann, wenn sie mit den richtigen Expertenhinweisen geleitet wird, zuverlässig Videoaufnahmen von Autobahnen „lesen“ und nicht nur erkennen, wie Lkw beladen sind, sondern auch, was sie antreibt – ohne teures, maßgeschneidertes Training. Diese Fähigkeit könnte Hafenbehörden und Regulierern ein leistungsfähiges neues Instrument geben, um den Wechsel von Diesel zu emissionsfreien Drayage‑Lkw zu überwachen, Standorte zu identifizieren, an denen neue Lade‑ oder Wasserstoffstationen besonders dringend benötigt werden, und unnötige Leerfahrten zu reduzieren. Während die aktuelle Studie einen bescheidenen Datensatz von einer einzelnen Kamera unter idealen Bedingungen verwendete, argumentieren die Autoren, dass sich dieselbe Strategie auf andere Frachtknoten und vielfältigere Umgebungen ausweiten lässt. Verantwortungsbewusst skaliert könnten Systeme wie ZeroDray die unsichtbaren Details der Frachtaktivität sichtbar machen und Gemeinden sowie Entscheidungsträgern helfen, Frachtkorridore sauberer und effizienter zu gestalten.

Zitation: Feng, G., Li, Y., Tok, A.Y.C. et al. Domain informed vision language model for sustainable freight with drayage truck powertrain and cargo classification. npj. Sustain. Mobil. Transp. 3, 15 (2026). https://doi.org/10.1038/s44333-026-00086-4

Schlüsselwörter: Null‑Emissions‑Lkw, Vision‑Language‑Modelle, Hafen‑Drayage, Fracht‑Emissionen, nachhaltiger Verkehr