Clear Sky Science · nl

Knowledge graph enhanced cross modal generative adversarial network for martial arts motion reconstruction and heritage preservation

· Terug naar het overzicht

Waarom hightech kungfu ertoe doet

Traditionele vechtsporten zijn meer dan spectaculaire trappen en stoten – het zijn levende dragers van filosofie, gezondheidspraktijken en culturele identiteit. Veel van deze vaardigheden bestaan echter alleen nog in de lichamen en herinneringen van ouder wordende meesters, en gewone videoregistraties leggen hun diepte niet volledig vast. Dit artikel onderzoekt hoe een geavanceerd kunstmatig-intelligentiesysteem vechtsporten op een rijke, betekenisvolle manier kan "leren", zodat toekomstige generaties niet alleen kunnen bestuderen hoe een beweging eruitziet, maar ook waarom ze op die manier wordt uitgevoerd.

Figure 1
Figure 1.

Het probleem met het filmen van oude vaardigheden

Eeuwenlang werden vechtsporten van leraar op leerling overgedragen, vaak met weinig schriftelijke vastlegging. Moderne camera’s en motion-capturepakken helpen, maar zijn nog steeds onvoldoende. Video maakt driedimensionale, hele-lichaamshandelingen plat tot twee dimensies, en zelfs geavanceerde sensoren kunnen subtiele gewichtsverschuivingen, interne krachtstromen of het tactische doel achter een beweging missen. Bestaande systemen leggen voornamelijk vast "wat" het lichaam doet – gewrichtshoeken en posities – terwijl ze de culturele ideeën en gevechtsprincipes die elke techniek ziel geven negeren. Daardoor kunnen gearchiveerde bewegingen er voor toevallige kijkers juist uitzien maar voor ervaren beoefenaars onjuist aanvoelen.

Een digitale kaart van vechtsportwijsheid

Om dit aan te pakken bouwen de auteurs eerst een grote kennisgraaf voor vechtsporten – in wezen een digitale kaart van concepten en relaties. Deze bevat individuele technieken, lichaamsdelen, kracht­richtingen, trainingsprogressies, kernideeën zoals “substantieel en onsubstantieel” gewicht, en de contexten waarin bewegingen worden ingezet. Koppelingen drukken relaties uit zoals "deze houding is de vereiste voor die slag" of "deze beweging belichaamt dit principe." Met graf-lerende methoden wordt elk item in deze kaart omgezet in een numerieke representatie waar een computer mee kan werken, terwijl de structuur van de expertkennis behouden blijft.

AI leren woorden, beelden en beweging te koppelen

Vervolgens ontwerpt het team een systeem dat vechtsporten tegelijk in meerdere vormen kan begrijpen: video-opnames van uitvoeringen, geschreven verklaringen en precieze motion-capturegegevens. Afzonderlijke modules analyseren elk type – een videonetwerk bestudeert de beeldframes, een taalmodel leest technische en historische beschrijvingen, en een op grafen gebaseerd model volgt hoe gewrichten in de tijd bewegen. Een speciale alignatiestap, gestuurd door de kennisgraaf, dwingt deze verschillende zichtwijzen tot overeenstemming over wat een techniek werkelijk is. Dit voorkomt dat de AI misleidende patronen oppikt en helpt bij het omgaan met zelden geziene bewegingen door ze te relateren aan beter bekende bewegingen via gedeelde principes.

Bewegingen genereren die authentiek aanvoelen

Bovenop deze basis bouwen de auteurs een bewegingsgenererende motor gebaseerd op generatieve adversariële netwerken. Een deel van het systeem stelt nieuwe bewegingssequenties voor; drie "critici" beoordelen ze vanuit verschillende invalshoeken: lokale houdingsnauwkeurigheid, coördinatie van het hele lichaam en stilistische trouw aan de vechtsport. Gedurende dit proces fungeert de kennisgraaf als een toezichthoudende meester, die de AI afremt van houdingen die het evenwicht zouden breken, de regels van een stijl zouden schenden of sleutel‑fasen van een techniek zouden negeren. In tests op zes belangrijke Chinese stijlen verminderde het systeem de fout in gewrichtsposities met meer dan een kwart vergeleken met sterke moderne referentiesystemen en behaalde het hoge scores voor het naleven van gecodeerde vechtprincipes.

Figure 2
Figure 2.

Meer dan mooie bewegingen: levende tradities redden

Voor niet‑specialisten is de conclusie dat het hier niet alleen om soepelere computeranimatie gaat. Door deskundige regels en culturele betekenis in het hart van een AI‑model te verankeren, kan de methode vormen reconstrueren die zowel fysiek verantwoord zijn als trouw aan het karakter van elke stijl – van de vloeiende cirkels van Baguazhang tot de explosieve lijnen van Xingyiquan. De auteurs betogen dat dergelijke kennisgestuurde systemen toekomstige leermiddelen, museumtentoonstellingen en digitale archieven kunnen aandrijven, zodat mensen traditionele kunsten interactief kunnen verkennen, zelfs zonder een meester aanwezig. Met verder werk kan dezelfde benadering ook helpen andere kwetsbare praktijken te bewaren, zoals klassieke dans of rituele uitvoeringen, en zo een nieuwe manier bieden waarop technologie menselijke traditie kan ondersteunen in plaats van vervangen.

Bronvermelding: Yue, X., Zhang, L. Knowledge graph enhanced cross modal generative adversarial network for martial arts motion reconstruction and heritage preservation. Sci Rep 16, 5925 (2026). https://doi.org/10.1038/s41598-026-36095-z

Trefwoorden: behoud van vechtsporten, generatie van menselijke beweging, kennisgrafen, cross-modale AI, generatieve adversariële netwerken