Clear Sky Science · nl

EKHI: een open database van optische en thermische stralings­eigenschappen van vaste materialen

· Terug naar het overzicht

Waarom hete materialen en verborgen gegevens ertoe doen

Van straalmotoren tot zonnecentrales en zelfs ruimtevaartuigen: veel geavanceerde technologieën zijn afhankelijk van hoe materialen gloeien, reflecteren en warmte doorgeven. Veel van de meest waardevolle experimentele data over deze eigenschappen stonden echter decennialang vast in oude gedrukte tabellen en grafieken. Dit artikel beschrijft hoe onderzoekers die verspreide informatie zorgvuldig hebben gered, gedigitaliseerd en georganiseerd in EKHI, een open online database die het veel eenvoudiger maakt voor wetenschappers en ingenieurs om betrouwbare gegevens te vinden en opnieuw te gebruiken over hoe vaste materialen met licht en warmte omgaan.

Een eeuw aan metingen ontsluiten

Al meer dan een halve eeuw meten ingenieurs hoe metalen, keramische materialen en coatings thermische straling uitzenden, reflecteren, absorberen en doorlaten over brede temperatuurs- en golflengtebereiken. Deze metingen zijn essentieel om te voorspellen hoe warm een ruimtevaartuigoppervlak wordt, hoe efficiënt een zonne-absorbeerder werkt of hoe een hittebestendige coating veroudert. De resultaten zijn echter van nature complex: ze hangen gelijktijdig af van temperatuur, golflengte en kijkrichting, evenals van microscopische details zoals oppervlaktestructuur en porositeit. Vanwege die complexiteit werden experimentele resultaten meestal gepubliceerd als dichte tabellen en grafieken, vergezeld van gedetailleerde aantekeningen over de monsterbereiding en de meetmethoden. Tot nu toe waren die gegevens moeilijk te doorzoeken of opnieuw te gebruiken in moderne computermodellen.

Bouwen op een klassieke referentiecollectie

Een belangrijke startpunt voor deze inspanning is de reeks Thermophysical Properties of Matter TPRC Data Series, een set referentiebanden uit de jaren zeventig die stralings­eigenschapsgegevens uit honderden oorspronkelijke studies uit de periode 1900–1970 verzamelde. Deze boeken worden nog steeds veel geciteerd omdat ze data voor metalen en legeringen, niet-metalen vaste stoffen en coatings kritisch evalueerden en ordenden. Ze bestonden echter alleen als gescande pagina’s. De auteurs van de huidige studie verkregen de digitale facsimiles van de TPRC-volumes uit een Amerikaans archief voor technische rapporten en behandelden die als de hoofdbronnen. Hun doel was de rijkdom van deze klassieke compilaties in het digitale tijdperk te brengen, met respect voor moderne verwachtingen dat wetenschappelijke data gemakkelijk te vinden, te benaderen, te combineren met andere datasets en betrouwbaar opnieuw te gebruiken moeten zijn.

Figure 1. Versnipperde historische gegevens over warmte en licht van vaste stoffen omzetten in één open, doorzoekbare onlinebron voor wetenschappers en ingenieurs.
Figure 1. Versnipperde historische gegevens over warmte en licht van vaste stoffen omzetten in één open, doorzoekbare onlinebron voor wetenschappers en ingenieurs.

Van gescande pagina’s naar gestructureerde bestanden

Het team ontwierp een stapsgewijze workflow om de gescande boeken om te zetten in machineleesbare bestanden. Eerst zetten ze literatuurlijsten, gedetailleerde beschrijvingstabellen en numerieke datatabellen om naar tekst met een mix van Python-tools, optische tekenherkenning, grote taalmodellen en zorgvuldige handmatige controles. Vervolgens gebruikten ze een online indexeerdienst om elk origineel artikel op te zoeken, de volledige referentie te bevestigen en te testen of het nog toegankelijk is. Alleen gegevens die terug te voeren waren op een momenteel bereikbaar primaire bron werden in de eerste uitgave opgenomen, waarbij kwaliteit en traceerbaarheid boven volume werden verkozen. Met behulp van identificatoren die in de boeken stonden afgedrukt, koppelden ze vervolgens elke reeks getallen aan de bijbehorende beschrijving van het experiment en monster, en aan de corresponderende publicatie. Ten slotte groepeerden ze al deze informatie in gestandaardiseerde digitale records.

Wat de EKHI-dataset bevat

De resulterende dataset bevat 1.251 curves met bijna 19.000 numerieke waarden, afkomstig uit 167 toegankelijke oorspronkelijke studies en 171 verschillende vaste materialen. Hij bestrijkt vier hoofdtypen radiatief gedrag: hoeveel een materiaal uitzendt, reflecteert, doorlaat of absorbeert aan thermische straling, onderverdeeld in specifieke gevallen zoals normale of hemisferische kijkcondities. De gegevens bestrijken temperaturen van bijna het absolute nulpunt tot smeltpunten en golflengten van ultraviolet tot ver-infrarood, met bijzonder brede dekking voor niet-metalen vaste stoffen. Reflectantie vormt meer dan de helft van de inzendingen, gevolgd door emissie en transmittantie, terwijl absorptiegegevens schaarser zijn. Elk record is opgeslagen in een veelgebruikt tekstgebaseerd formaat genaamd JSON en bevat de ruwe cijfers, eenheden, een beschrijving van het monster en de meetopstelling, en de volledige publicatiegegevens, allemaal zo ingericht dat computers de structuur automatisch kunnen controleren en interpreteren.

Figure 2. Een stapsgewijs proces dat oude tabellen en grafieken opschoont en transformeert tot gestructureerde, computerklare gegevensrecords over materiaalgedrag.
Figure 2. Een stapsgewijs proces dat oude tabellen en grafieken opschoont en transformeert tot gestructureerde, computerklare gegevensrecords over materiaalgedrag.

Betrouwbaarheid controleren en de tools delen

Aangezien de oorspronkelijke metingen decennia geleden zijn uitgevoerd, proberen de auteurs niet de wetenschappelijke kwaliteit opnieuw te beoordelen maar richten ze zich op het behouden en valideren van de digitalisering. Ze verifieerden handmatig dat elk genoemd artikel bereikbaar is, dat de bibliografische gegevens overeenkomen en dat de gekopieerde tabellen en aantekeningen regel voor regel overeenstemmen met de gedrukte boeken. Verdachte punten werden gemarkeerd en visueel geïnspecteerd via de EKHI-website, die gebruikers laat bladeren door materialen en eigenschappen en curves interactief laat plotten. Het team voerde ook automatische controles uit om te waarborgen dat elk JSON-bestand een vooraf gedefinieerd patroon volgt. Naast de dataset hebben ze de scripts vrijgegeven die voor de verwerking van de gegevens werden gebruikt en de formele beschrijving van de bestandsstructuur, zodat anderen het werk kunnen reproduceren, uitbreiden of dezelfde aanpak op nieuwe bronnen kunnen toepassen.

Wat dit betekent voor toekomstig onderzoek

Eenvoudig gezegd laat dit artikel zien hoe een grote, moeilijk te gebruiken stapel oude maar waardevolle metingen is omgezet in een heldere, doorzoekbare en herbruikbare bron. EKHI vervangt geen nieuwe experimenten en pretendeert ook niet het laatste woord te spreken over de beste waarden voor een eigenschap. In plaats daarvan maakt het het veel eenvoudiger voor onderzoekers om verschillende studies te vergelijken, ongewone resultaten te herkennen en realistische radiatieve eigenschappen in simulaties of datagedreven modellen te voeden. Door numerieke waarden te koppelen aan rijke context en te zorgen dat elke curve terug te leiden is naar het oorspronkelijke artikel, biedt EKHI een degelijke basis voor toekomstig werk aan hoe vaste materialen met warmte en licht omgaan.

Bronvermelding: Gabirondo-López, J., Sainz-Menchón, M., Tolosa-Lecea, I. et al. EKHI: an open database of optical and thermal radiative properties of solid materials. Sci Data 13, 740 (2026). https://doi.org/10.1038/s41597-026-07083-9

Trefwoorden: thermische stralings­eigenschappen, optische gegevens, materiaalendatabase, emissie reflectie, FAIR-gegevens