Clear Sky Science · nl

Ongecontroleerd multimodaal deep learning voor sterrenstelselmorfologie: integratie van ConvNeXt-embedings en morfologische parameters voor schaalbare survey-wetenschap

2026-04-11 · Terug naar het overzicht

Computers leren de vormen van sterrenstelsels te lezen

Moderne hemel-surveys fotograferen miljarden sterrenstelsels, veel meer dan enige groep astronomen — of burgerwetenschappers — ooit met het blote oog kan classificeren. Toch bevatten de vormen van sterrenstelsels, van gladde ellipsen tot grote spiraalstelsels en chaotische fusies, belangrijke aanwijzingen over hoe het heelal zijn structuren opbouwt. Dit artikel introduceert een nieuwe methode waarmee computers sterrenstelsels automatisch kunnen sorteren zonder van tevoren te worden verteld waar ze op moeten letten, wat de deur opent naar het verkennen van kosmische structuren op werkelijk enorme schaal.

Waarom vormen van sterrenstelsels ertoe doen

Sterrenstelsels zijn niet alleen mooie plaatjes; hun verschijningsvorm legt hun levensverhalen vast. Gladde, ronde systemen zijn vaak ouder en rustiger, terwijl sterrenstelsels met opvallende spiraalarmen of vervormde vormen vaak duiden op lopende stervorming of recente botsingen. Al een eeuw ordenen astronomen deze vormen in families — zoals ellipticals, spiralen en onregelmatige stelsels — om zichtbare structuur te verbinden met onderliggende fysica. Maar naarmate projecten zoals de Sloan Digital Sky Survey en aanstaande observatoria zoals het Rubin Observatory’s Legacy Survey of Space and Time de hemel met ongekende diepte in kaart brengen, is handmatig labelen praktisch onhoudbaar geworden.

Van menselijke labels naar onbegeleide ontdekking

De meeste recente vooruitgangen in automatische sterrenstelselclassificatie vertrouwen op begeleid deep learning: computers leren van duizenden voorbeelden die mensen al hebben gelabeld. Dat werkt goed, maar hangt af van nauwgezet gemaakte trainingssets en is beperkt tot de categorieën die mensen van tevoren definiëren. De auteurs volgen in plaats daarvan een onbegeleide route en laten het algoritme natuurlijke groeperingen in de data zelf ontdekken. Daartoe gebruiken ze krachtige beeldanalyzenetwerken die oorspronkelijk op alledaagse foto’s zijn getraind, en passen die aan sterrenstelselbeelden aan om rijke visuele vingerafdrukken te extraheren, allemaal zonder dat een enkel sterrenstelsel een vooraf toegewezen label nodig heeft.

Beelden mengen met fysieke metingen

Sterrenstelselbeelden bevatten enorme details, maar astronomen gebruiken ook eenvoudige numerieke beschrijvingen van structuur, zoals hoe geconcentreerd het licht is, hoe scheef het sterrenstelsel lijkt, hoe klonterig de stervormende gebieden zijn en hoe ongelijkmatig het licht over de pixels is verdeeld. Het team combineert beide werelden: diepe visuele kenmerken van twee moderne neurale netwerken en vijf klassieke structurele maten. Omdat de beeldgebaseerde beschrijving uit duizenden getallen bestaat terwijl de fysieke maten slechts een handvol zijn, bouwen ze een speciaal “multimodaal autoencoder” — een type neuraal netwerk dat alle informatie comprimeert tot een compact intern codewoord. Deze 64-getallen-code dwingt het systeem een balans te vinden tussen wat het uit de beelden leert en wat bekend is uit basale sterrenstelfysica.

De data in natuurlijke families laten vallen

Zodra elk van de 4.950 zorgvuldig schoongemaakte Sloan-surveysterrenstelsels is gereduceerd tot deze gebalanceerde, 64-dimensionale code, passen de auteurs een probabilistische clusteringtechniek toe die de sterrenstelselpopulatie behandelt als een gladde mengeling van overlappende groepen. In plaats van scherpe grenzen af te dwingen, kent het systeem elk sterrenstelsel een mate van lidmaatschap in meerdere clusters toe en markeert het slechts de meest extreme 2 procent als echte eigenaardigheden of artefacten. De resulterende hoofdclusters komen goed overeen met vertrouwde families: gladde, compacte systemen die lijken op vroeg-type sterrenstelsels; diffuse, klonterige schijven vergelijkbaar met laat-type spiralen; interacterende en verstoorde systemen; en tussenvormen, overgangsschijven. Interne tests tonen aan dat deze gecombineerde beeld-en-fysica representatie schonere, meer coherente groepen oplevert dan alleen beelden of structurele getallen.

Vergelijken met klassieke regels en opschalen

Om te beoordelen of de onbegeleide groeperingen fysisch zinvol zijn, vergelijken de auteurs ze met lang gebruikte vuistregel-grenzen gebaseerd op eenvoudige structuurgrafieken. Hoewel het algoritme nooit menselijke labels heeft gezien, komt ongeveer de helft van de indelingen overeen met deze traditionele categorieën, terwijl de rest subtielere variaties onthult die de oudere, tweeparameterregels samen laten vloeien. Net zo belangrijk is dat de hele pijplijn snel draait: elk sterrenstelsel kan in slechts enkele tientallen milliseconden op moderne hardware worden verwerkt, een tempo dat geschikt is voor petabyte-schaal surveys die binnenkort miljarden sterrenstelsels zullen catalogiseren.

Een nieuwe kaart van de Galaxy Zoo

In dagelijkse termen laat dit werk zien hoe je een computer kunt leren sterrenstelsels te "zien" en te groeperen op een manier die zowel respecteert wat astronomen al weten als wat de data nog kan verbergen. Door visuele patronen te mengen met eenvoudige fysieke metingen en door geleidelijke overgangen toe te staan in plaats van starre vakken, bouwt de methode een flexibele, schaalbare taxonomie van sterrenstelsels. Deze benadering zou wetenschappers moeten helpen de komende vloed aan hemelbeelden te doorzoeken, zeldzame of ongebruikelijke systemen te ontdekken en ons beeld te verfijnen van hoe sterrenstelsels zich vormen, onderling omgaan en door kosmische tijd veranderen.

Bronvermelding: Selim, I.M., Farahat, A.S., Basmsm, L.H. et al. Unsupervised multimodal deep learning for galaxy morphology taxonomy: integrating ConvNeXtEmbeddings and morphological parameters for scalable survey science. Sci Rep 16, 12183 (2026). https://doi.org/10.1038/s41598-026-45369-5

Trefwoorden: sterrenstelselmorfologie, onbegeleid leren, deep learning, astronomische surveys, clustering