Clear Sky Science · nl

Een spiking neurale netwerk geïnspireerd door neurowetenschap en psychologie voor Westers modus- en toonsoort‑geconditioneerd muziekleren en compositie

2026-03-10 · Terug naar het overzicht

Waarom het belangrijk is om computers toonsoorten te leren horen

De meeste mensen voelen wanneer een liedje “thuis” is gekomen bij zijn slotnoot, of wanneer een verkeerde akkoorden alles uit balans brengt. Dat onderbuikgevoel berust op verborgen regels van muzikale toonsoort en modus — het tonaal skelet onder de westerse muziek. Moderne kunstmatige intelligentie kan eindeloze melodieën produceren, maar negeert deze regels vaak of codeert ze op grove wijze in. Dit artikel introduceert een nieuw door de hersenen geïnspireerd model dat toonsoorten en modi leert zoals een menselijke luisteraar dat doet, en dat die kennis vervolgens gebruikt om vierstemmige harmonie te componeren. Het doel is om muziekmakende machines niet alleen muzikaler, maar ook beter begrijpelijk te maken.

Van alledaags luisteren naar interne klankkaarten

Wanneer je naar muziek luistert, bouwt je brein geleidelijk een intern kaartje op van welke tonen stabiel aanvoelen, welke gespannen klinken en hoe patronen meestal verlopen. Psychologen vatten dit samen met het Krumhansl–Schmuckler‑model, dat meet hoe sterk elk van de 12 toonklassen in een gegeven toonsoort past. De neurowetenschap koppelt dit soort schematische kennis aan hersengebieden die ervaring in de tijd organiseren, zoals de mediale prefrontale cortex en geheugenstructuren als de hippocampus. De auteurs betogen dat de meeste deep‑learning muzieksystemen deze psychologische en biologische inzichten overslaan: ze dwingen stukken vaak in een referentietoonsoort of behandelen toonsoort als een simpel label, en hun interne werking is moeilijk te interpreteren. Het nieuwe werk stelt in plaats daarvan een netwerk voor waarvan de interne verbindingen direct vergeleken kunnen worden met menselijke tonale perceptie.

Een hersenachtig netwerk dat zowel toonladders als sequenties hoort

De onderzoekers ontwerpen een spiking neurale netwerk, een type model dat communiceert met korte elektrische pulsen, waarmee echte neuronen wordt nagebootst. Ze verdelen het in twee hoofdsubsystemen. Een “tonale” subsysteem vertegenwoordigt modi (majeur en mineur) en de 24 toonsoorten die in de westerse tonale muziek worden gebruikt, gerangschikt in een hiërarchie die doet denken aan hoe de hersenen abstracte schema’s opslaan. Een “sequentieel geheugen” subsysteem houdt de daadwerkelijke noten van een vierstemmig stuk vast — hun toonhoogtes en duur — verdeeld over aparte stromen die corresponderen met sopraan, alt, tenor en bas. Binnen deze stromen worden toonhoogte en duur gecodeerd door arrays van kleine kolommen neuronen, losjes geïnspireerd op de organisatie van de auditieve cortex en tijdgevoelige cellen uit timingonderzoek.

Verbindingen laten groeien met ervaring

In plaats van alles van tevoren vast te bedraden, laat het model nieuwe synapsen ontstaan tussen het tonale subsysteem en het sequentiële geheugen wanneer neuronen herhaaldelijk samen vuren terwijl een stuk wordt ingevoerd. Dit bootst na hoe neurale circuits ontstaan en veranderen tijdens leren. Zodra een verbinding bestaat, wordt de sterkte aangepast door een regel genaamd spike‑timing‑dependent plasticity: als een bronneuron de neiging heeft net vóór een doelneuron te vuren, versterkt de koppeling; als de volgorde omgekeerd is, verzwakt die. Na veel stukken, inclusief oefenvoorbeelden die zorgvuldig zijn ontworpen om specifieke harmonische ideeën te benadrukken en een grote verzameling van J.S. Bach‑koraalbewerkingen, gaat de interne bedrading van het netwerk geleidelijk weerspiegelen welke noten in elke modus en toonsoort centraal, ondersteunend of zeldzaam functioneren.

In het besef van de machine van toonsoort

Om te testen of het model werkelijk mensachtige tonale verwachtingen ontwikkelde, maten de auteurs twee kenmerken van zijn geleerde verbindingen: hoeveel synapsen elke toonklasse had opgebouwd, en hoe sterk die synapsen gemiddeld waren geworden. Ze vergeleken deze patronen vervolgens met de bekende psychologische toonsoortprofielen. Zowel voor majeur als mineur en over veel individuele toonsoorten was de overeenkomst opvallend groot. Tonen die mensen als de “thuis”-toon of de belangrijkste ondersteunende tonen horen, verschenen ook als de meest sterk verbonden in het netwerk. Subtiele verschillen weerspiegelen het trainingsmateriaal — bijvoorbeeld oefenvoorbeelden die bepaalde akkoorden benadrukken duwden het netwerk om die tonen sterker te wegen. Dit suggereert dat het model zowel algemene tonale wetten als corpus‑specifieke gewoonten vastlegt, vergelijkbaar met menselijke enculturatie.

Nieuwe muziek componeren in een gekozen toonsoort

Wanneer het systeem gevraagd wordt te componeren, krijgt het een doelmodus en toonsoort, plus een korte startakkoord. Activiteit in de toonsoortspecifieke neuronen biasert vervolgens het sequentiële geheugensubsysteem via de geleerde verbindingen. Concurrerende notenneuronen vuren en een eenvoudige “winner‑takes‑all” regel kiest de volgende noot in elke stem. Stap voor stap genereert het model nieuwe vierstemmige harmonieën die binnen de bedoelde toonsoort blijven terwijl ze toch gevarieerde melodische vormen verkennen. Vergeleken met een reeks populaire deep‑learning modellen — waaronder recurrente netwerken, transformers en diffusie‑modellen — produceert het spiking‑model stukken waarvan de toonhoogte‑bereiken, gebruik van toonladentonen en andere structurele statistieken nauwer lijken op die van de referentiedatasets. Met name houdt het een zeer groot aandeel in‑toonsoort tonen aan zonder monotoon te worden.

Wat dit betekent voor toekomstige muzikale machines

Voor een algemene lezer is de belangrijkste uitkomst dat een door de hersenen geïnspireerd netwerk iets kan leren dat dicht bij ons intuïtieve gevoel voor toonsoort en schaal ligt — en dat we die kennis rechtstreeks in de bedrading kunnen zien. Het model behandelt nog niet alle rijkdom van echte muziek, zoals veranderende harmonie, ritmische variatie of expressieve timing. Toch biedt het een concrete brug tussen muziektheorie, psychologie en neurale berekening. Door te laten zien dat een biologisch gemotiveerd systeem overtuigende, toonsoort‑bewuste harmonieën kan genereren en kan onthullen hoe het daartoe kwam, wijst dit werk op toekomstige muziek‑AI die zowel muzikaaler onderlegd als transparanter is in hoe het over klank denkt.

Bronvermelding: Liang, Q., Zeng, Y. & Tang, M. A spiking neural network inspired by neuroscience and psychology for Western mode- and key-conditioned music learning and composition. Sci Rep 16, 12956 (2026). https://doi.org/10.1038/s41598-026-43529-1

Trefwoorden: spiking neurale netwerken, muziekgeneratie, muzikale toonsoort en modus, computationele muziekcognitie, hersen-geïnspireerde AI