Clear Sky Science · nl

Een deep reinforcement learning-aanpak voor dynamische aanpassing van transactiekosten in Ethereum

2026-03-31 · Terug naar het overzicht

Waarom dit belangrijk is voor alledaagse crypto-gebruikers

Iedereen die geprobeerd heeft een betaling te sturen of een non-fungible token te minten op Ethereum heeft waarschijnlijk te maken gehad met verwarrende vergoedingen die alle kanten op springen en lange wachttijden wanneer het netwerk druk is. Dit artikel onderzoekt een nieuwe manier om die vergoedingen vast te stellen met een kunstmatige-intelligentie-techniek, zodat het netwerk soepel en voorspelbaar blijft, zelfs wanneer de vraag plotseling sterk stijgt.

Figure 1. Een AI-controller houdt het Ethereum-transactieverkeer soepel en de vergoedingen stabiel bij wisselende vraag.

Hoe Ethereum-vergoedingen vandaag werken

Ethereum brengt kosten in rekening voor elke bewerking met een eenheid genaamd gas, en gebruikers betalen een gasprijs om hun transacties in een block te laten opnemen. Sinds 2021 probeert een ingebouwde regel, EIP-1559, dit proces eerlijker en voorspelbaarder te maken door een basisvergoeding aan te passen die iedereen moet betalen, terwijl een extra fooi mogelijk is voor snellere service. Wanneer blocks grotendeels vol zitten, stijgt de basisvergoeding, en als er ruimte over is, daalt die. Deze regelgebaseerde aanpak werkte beter dan eerdere veilingmechanismen, maar heeft nog steeds moeite bij scherpe vraagpieken, zoals populaire NFT-releases, en wanneer veel gebruikers hun transacties op vergelijkbare niveaus waarderen.

Waar de huidige regels tekortschieten

De auteurs laten zien dat EIP-1559 zich slecht kan gedragen tijdens echte en gesimuleerde periodes van hoge vraag. Tijdens een beruchte NFT-mint in 2022 bijvoorbeeld bleef gasgebruik rond de blocklimiet schommelen terwijl de basisvergoeding wild heen en weer zwaaide, wat leidde tot instabiele kosten en congestie. Vorig onderzoek toonde ook aan dat wanneer gebruikers zeer vergelijkbare waarderingen aan hun transacties toekennen, kleine wijzigingen in de basisvergoeding blocks van bijna leeg naar volledig vol en weer terug kunnen duwen. Dergelijke boom-en-bust-patronen verspillen blockruimte en maken het moeilijk voor gebruikers om te raden wat ze zouden moeten betalen.

Figure 2. Stapsgewijze weergave van een AI-agent die de basisvergoeding afstelt zodat blokgroottes naar een stabiel patroon neigen.

Een AI-agent het juiste tarief laten leren

In plaats van hard te coderen hoe de basisvergoeding op vraag reageert, behandelen de auteurs het vaststellen van vergoedingen als een leerprobleem. Ze bouwen een gesimuleerde, Ethereum-achtige omgeving waarin een agent de huidige basisvergoeding observeert, hoeveel gas in het laatste block is gebruikt, en verschillende details over de gedeelde transactiepoule, zoals hoeveel nieuwe en hangende transacties er zijn en welke vergoedingen gebruikers aanbieden. Op basis van deze toestand kiest de agent een kleine aanpassing van de basisvergoeding. Na elk block ontvangt hij een beloning die hoger is wanneer het gasgebruik dicht bij een doelwaarde ligt en lager wanneer blocks te leeg of te vol zijn. Met deep reinforcement learning ontdekt de agent geleidelijk een patroon van aanpassingen dat het gebruik dicht bij het doel houdt en extreme schommelingen vermijdt.

Het nieuwe vergoedingmechanisme onder veel omstandigheden testen

De onderzoekers voeren uitgebreide simulaties uit die verschillende marktscenario’s nabootsen. In sommige scenario’s stijgt of daalt de transactievraag geleidelijk; in andere piekt deze scherp of daalt plotseling. Ze variëren ook het gebruikersgedrag, waarbij ze onderscheid maken tussen degenen die simpelweg een vaste fooi betalen en degenen die hun fooi verhogen wanneer blocks druk zijn. Over deze opzetten heen wordt het geleerde beleid vergeleken met de standaard EIP-1559-regel. De belangrijkste maatstaven zijn hoe dicht het gemiddelde gasgebruik bij de doelwaarde blijft, hoeveel het gasgebruik van block tot block fluctueert, en hoe volatiel de basisvergoeding in de tijd is.

Wat de resultaten zeggen over stabiliteit en flexibiliteit

Het op deep learning gebaseerde mechanisme houdt consequent het gasgebruik dicht bij het gewenste niveau en vermindert de variabiliteit vergeleken met EIP-1559. De verbetering is vooral opvallend wanneer gebruikerswaarderingen in een smal bereik liggen, precies de situatie waarin de huidige regel in chaotische patronen kan vervallen. In die gevallen vermindert de nieuwe methode de schommelingen in gasgebruik met ongeveer een factor tien en maakt de basisvergoeding veel stabieler. De agent reageert ook eleganter op plotselinge pieken: hij verhoogt de basisvergoeding snel genoeg om het gebruik terug naar het doel te trekken zonder net zo sterk te overschieten als de oude regel. Door aan te passen hoe snel de vergoeding mag bewegen en door transactiepoortinformatie toe te voegen of te verwijderen, tonen de auteurs aan dat netwerkbeheerders de afweging tussen reactievermogen en soepelheid kunnen afstemmen.

Wat dit betekent voor toekomstige blockchain-vergoedingen

Voor een leek suggereert de studie dat slimme algoritmen Ethereum-vergoedingen minder tot een gokspel kunnen maken. Een vergoedingssysteem dat leert van realtime-activiteit in plaats van een vaste formule te volgen, kan blocks goed benut houden, wilde tarifaire schommelingen beperken en drukke periodes met minder verstoring afhandelen. Hoewel het werk is gebaseerd op simulaties en zorgvuldige tests nodig heeft vóór uitrol, wijst het in de richting van vergoedingsmechanismen die zich aanpassen aan veranderende omstandigheden en zowel de gebruikerservaring als de netwerk efficiëntie kunnen verbeteren.

Bronvermelding: Jang, H., Shim, J. A deep reinforcement learning approach for dynamic transaction fee adjustment in Ethereum. Sci Rep 16, 15600 (2026). https://doi.org/10.1038/s41598-026-46368-2

Trefwoorden: Ethereum-vergoedingen, reinforcement learning, blockchain-economie, gasprijs, transactiecongestie