Clear Sky Science · de

Deep Learning zur dynamischen Erkennung taktischer Formationen im Profi‑Fußball

· Zurück zur Übersicht

Das Spiel mit KI lesen

Wenn Fans ein Fußballspiel sehen, sprechen sie oft von Formationen wie 4‑4‑2 oder 4‑3‑3. Auf dem Feld hingegen biegen, dehnen und verwandeln sich diese Formationen ständig, während Spieler sprinten, pressen und zurückfallen. Diese Arbeit zeigt, wie moderne künstliche Intelligenz jene ständig wechselnden Muster in Echtzeit verfolgen kann und rohe Bewegungsdaten in ein detailliertes Bild darüber verwandelt, wie Teams tatsächlich spielen – Sekunde für Sekunde.

Figure 1
Figure 1.

Warum Formationen mehr sind als Zahlen

Eine Formation ist mehr als eine Zahlenreihe auf der Taktiktafel. Sie ist der Bauplan, der organisiert, wo Spieler stehen, wie sie sich gemeinsam bewegen und wie sie zwischen Angriff und Verteidigung wechseln. Traditionelle Analysen beruhten auf Trainern, die Video anschauen und Notizen machen – ein langsamer, subjektiver Prozess, der Mühe hat, subtile Verschiebungen zu erfassen. Frühere computergestützte Methoden frierten die Aktion oft in statische Momentaufnahmen ein, etikettierten jede einzelne mit einer einzigen Formation und ignorierten den kontinuierlichen Spielfluss. Dadurch gingen wichtige Merkmale des modernen Fußballs verloren: Spieler tauschen spontan Rollen, Linien bewegen sich synchron und Strategien entfalten sich über verschiedene Zeitskalen, von einem schnellen Pressing bis zu langfristigen taktischen Anpassungen.

Von roher Bewegung zu taktischen Einsichten

Die Autoren schlagen ein neues KI‑Modell vor, den Hierarchical Dual‑Stream Spatiotemporal Graph Transformer (HDS‑SGT), das speziell dafür entwickelt wurde, diesen komplexen Bewegungen zu folgen. Als Eingabe nutzt es die im Elitefußball inzwischen üblichen Trackingdaten: die zweidimensionalen Positionen aller Feldspieler, zehnmal pro Sekunde sampelnd, sowie aus diesen Positionen abgeleitete Informationen wie Geschwindigkeit, Beschleunigung und Abstände zu Mitspielern. Bevor irgendein Lernen beginnt, bereinigt und standardisiert das System die Daten – es zentriert sie auf das Team, glättet verrauschte Messwerte und fügt Merkmale hinzu, die erfassen, wie eng oder weit verteilt die Spieler stehen. So lässt sich dieselbe Formation erkennen, egal ob ein Team tief verteidigt oder hoch presst.

Zwei Sichtweisen auf Raum und Zeit

HDS‑SGT analysiert das Spiel durch zwei komplementäre Linsen. Ein Stream behandelt das Team als Netzwerk: Jeder Spieler ist ein Punkt, und Verbindungen entstehen zwischen Spielern, die auf dem Feld nah genug beieinanderliegen, um sich gegenseitig zu beeinflussen. Diese graphbasierte Sicht hilft dem Modell, Muster zu lernen wie kompakte Abwehrlinien oder Dreiecke im Mittelfeld. Gleichzeitig konzentriert sich ein zweiter Stream darauf, wie sich die Gesamtform des Teams über längere Zeitabschnitte entwickelt. Er komprimiert die Bewegungen aller Spieler zu team‑weiten Signalen und nutzt einen Aufmerksamkeitsmechanismus – ursprünglich für maschinelle Übersetzung entwickelt – um zu entdecken, welche Momente in der Vergangenheit am wichtigsten sind, um die Gegenwart zu verstehen. Wesentlich ist, dass dieser zweite Stream gleichzeitig auf mehreren Zeitskalen arbeitet, von schnellen Verschiebungen über wenige Sekunden bis zu langsameren Umstrukturierungen über eine volle Spielminute.

Figure 2
Figure 2.

Rollen folgen statt Rückennummern

Ein besonders herausfordernder Aspekt des modernen Fußballs ist, dass Spieler häufig Aufgaben tauschen: Ein Außenverteidiger stürmt wie ein Flügelspieler nach vorn, ein Mittelfeldspieler fällt in die Abwehrkette zurück oder ein Stürmer führt das Pressing im Mittelfeld an. Fixe Labels, die an Rückennummern gebunden sind, kommen mit dieser Fluidität nicht hinterher. Um das zu adressieren, enthält das Modell ein Dynamic Role Assignment Module. Anstatt anzunehmen, dass ein bestimmter Spieler immer beispielsweise Linksverteidiger ist, lernt es flexible „Rollen‑Vorlagen“ basierend auf dem Verhalten der Spieler. In jedem Moment vergleicht es die aktuelle Bewegung und Position jedes Spielers mit diesen Vorlagen und weist ihnen eine Mischung aus Rollen zu, die sich über die Zeit glatt verändern kann. Eine eingebaute Strafkomponente entmutigt unrealistisch abruptes Rollenwechseln und spiegelt wider, dass echte taktische Änderungen sich meist über mehrere Sekunden und nicht in einem einzigen Augenblick entfalten.

Was das Modell in echten Spielen erreichte

Die Forscher testeten ihr System an Trackingdaten aus 847 Profispielen in mehreren Wettbewerben, was mehr als 1.200 Spielstunden abdeckt. Experten‑Trainer lieferten detaillierte Labels und markierten nicht nur, welche Formation verwendet wurde, sondern auch, wann Teams dabei waren, ihre Form zu ändern. Gegenüber einer breiten Palette bestehender Methoden – von klassischen statistischen Modellen bis zu modernen Deep‑Learning‑Architekturen – erwies sich HDS‑SGT als deutlich genauer. Es erkannte Formationen in etwa 95 % der Zeitfenster korrekt und detektierte taktische Übergänge mit einer hohen F1‑Score, einer ausgewogenen Messgröße für Präzision und Trefferquote. Diese Verbesserungen waren besonders stark bei seltenen oder ungewöhnlicheren Formationen und bei komplexen Momenten, in denen viele Spieler gleichzeitig Positionen tauschen. Wichtig ist auch: Nach dem Training kann das Modell auf einer handelsüblichen Grafikkarte schnell genug laufen, um mit Live‑Spielen Schritt zu halten und mehr als zwanzig Frames Trackingdaten pro Sekunde zu analysieren.

Vom Laborwerkzeug zum Seitenlinien‑Assistenten

Für Laien ist die wichtigste Erkenntnis, dass diese Arbeit die vage Idee von „Form“ in etwas verwandelt, dem ein Computer in Echtzeit folgen kann. Indem das System eine Netzwerkperspektive darauf kombiniert, wie Spieler zueinander in Beziehung stehen, eine Multi‑Skalen‑Sicht darauf, wie Taktiken sich über die Zeit entfalten, und ein flexibles Rollenverständnis, kann es nicht nur erkennen, welche Formation ein Team nutzt, sondern auch, wann diese Formation beginnt, sich zu verändern. Obwohl die Studie sich auf Elite‑Trackingdaten und spezifische Hardware konzentriert, weist der Ansatz auf zukünftige Werkzeuge hin, die Trainer, Analysten und sogar Sender unterstützen könnten – und live objektive Einblicke in die versteckte taktische Geschichte bieten, die unter der Oberfläche jedes Spiels abläuft.

Zitation: Wang, Y., ShangGuan, Q., Chen, G. et al. Deep learning for dynamic tactical formation recognition in professional football. Sci Rep 16, 13846 (2026). https://doi.org/10.1038/s41598-026-41383-9

Schlüsselwörter: Fußballtaktik, Formationsanalyse, Sportanalytik, Deep Learning, Spieler‑Tracking‑Daten