Clear Sky Science · sv
Prediktion, syntax och semantisk förankring i hjärnan och stora språkmodeller
Hur din hjärna gissar nästa ord
När du lyssnar på en berättelse känns det ofta enkelt att hänga med—men under ytan gissar din hjärna ständigt vad som kommer härnäst. Samtidigt förutsäger moderna AI-system som stora språkmodeller (LLM) också kommande ord för att generera flytande text. Denna studie förenar dessa två världar och undersöker hur den mänskliga hjärnan förväntar sig ord i realtid och hur dessa processer står sig i jämförelse med hur en avancerad AI-modell fungerar.

Att lyssna på en berättelse i labbet
För att studera naturlig språkförståelse gick forskarna bortom artificiella ordlistor eller korta, isolerade meningar. Istället lyssnade 29 unga vuxna frivilliga på ungefär 50 minuter av en tysk science fiction-ljudbok medan deras hjärnaktivitet registrerades. Två kompletterande tekniker användes samtidigt: elektroencefalografi (EEG), som mäter små spänningsförändringar vid skalpen, och magnetoencefalografi (MEG), som upptäcker de magnetfält som genereras av hjärnaktivitet. Tillsammans kan dessa metoder följa hjärnans svar på varje ord med millisekundprecision medan försökspersonerna följer en kontinuerlig handling.
Att följa olika typer av ord
Ljudboken delades automatiskt upp i individuella ord och märktes med grammatisk typ: substantiv (såsom ”planet”), verb (såsom ”springa”), adjektiv (såsom ”mörk”) och egennamn. För varje ord i berättelsen skar forskarna ut ett kort tidsfönster av EEG- och MEG-signalerna före och efter att ordet uttalades och genomsnittade dessa segment inom varje ordklass. Detta avslöjade tillförlitliga elektriska och magnetiska ”signaturer” för de olika ordtyperna, inklusive välkända komponenter kopplade till betydelse och meningsstruktur. Viktigt var att teamet fann att aktiviteten för substantiv började byggas upp redan innan ordet faktiskt började, vilket tyder på att hjärnan var särskilt förberedd på denna typ av ord i kontexten.
Var betydelse möter rörelse
För att se var i hjärnan dessa signaler uppstod använde forskarna datormodeller för att uppskatta de sannolika källorna till MEG- och EEG-mönstren inuti huvudet. Substantiv aktiverade inte bara klassiska språkregioner i tinningloben; de engagerade också områden förenliga med delar av sensorimotoriska systemet, nära regioner involverade i rörelse och kroppslig känsel. Verb, däremot, visade ett annorlunda och mer begränsat mönster. Detta stärker idén om ett ”inkroppsligat” språk, där förståelsen av ett ord—särskilt ett konkret substantiv—delvis återaktiverar nätverk knutna till perception och handling och förankrar betydelsen i tidigare sensoriska erfarenheter snarare än enbart i abstrakta regler.
Att jämföra hjärnor och stora språkmodeller
Teamet vände sig sedan till Metas Llama 3.2-språkmodell för att ge en beräkningsmässig referenspunkt. Först testade de ”semantisk prediktion” genom att mata modellen med den föregående kontexten från ljudboken och fråga hur sannolikt den bedömde att det verkliga nästa ordet var. Substantiv visade sig vara lättast för modellen att förutsäga, vilket stämmer med deras centrala roll i att bygga upp berättelsen. Därefter utforskade forskarna ”syntaktisk prediktion” genom att undersöka de interna aktiveringarna, eller embeddingarna, i Llama. Även utan extra träning grupperade modellens dolda lager naturligt ord enligt den grammatiska typen av det följande ordet, och ett enkelt provnätverk kunde ofta avgöra vilken ordklass som skulle komma härnäst. Genom lagren blev den interna strukturen för egennamn och substantiv mer distinkt, vilket speglar den ökande differentieringen av roller som sågs i hjärnans aktivitetsmönster.

Två slags beredskap för ord
Tillsammans tyder fynden på att hjärnan förbereder sig för kommande språk på minst två nivåer. I temporala regioner verkar aktiviteten före ordstart återspegla en form av grammatisk eller ”syntaktisk” beredskap—kunskap om var vissa ordtyper tenderar att förekomma i en mening. I mer frontala och sensorimotoriska regioner tycks beredskapsmönstren bära rikare ”semantiska” förväntningar kopplade till betydelse och erfarenhet, särskilt för substantiv och namn. Stora språkmodeller, tränade enbart för att förutsäga nästa ord, utvecklar sina egna flerskiktade interna strukturer som delvis speglar dessa skillnader, men de saknar direkt förankring i den fysiska världen. Genom att kombinera högupplösta hjärnregistreringar med analyser av toppmoderna AI bidrar detta arbete till att klargöra hur människor förutser ord under vardagligt lyssnande och hur långt dagens maskiner har kommit i att approximera denna kärnegenskap i mänsklig språkförståelse.
Citering: Kölbl, N., Rampp, S., Kaltenhäuser, M. et al. Prediction, syntax and semantic grounding in the brain and large language models. Sci Rep 16, 8728 (2026). https://doi.org/10.1038/s41598-026-41532-0
Nyckelord: språkprediktion, hjärnan och AI, stora språkmodeller, semantisk förankring, EEG MEG språk