Clear Sky Science · sv

Determinanter för upplösning av visuell tvetydighet

2026-03-17 · Tillbaka till index

Gåta i vardagssynen

Har du någon gång stirrat på en suddig svartvit bild som plötsligt ”poppar” upp som ett tydligt föremål efter att någon berättat vad det är? Denna studie gräver i den där vardagsmagin. Forskarna undersöker varför vissa suddiga bilder förblir envist förvirrande medan andra plötsligt träffar rätt i vårt sinne, och vad som faktiskt förändras i våra hjärnor när vi till sist ”fattar” vad vi ser.

Göra klara bilder till visuella gåtor

För att undersöka dessa frågor skapade teamet en stor samling visuella gåtor. De började med 1 854 foton av vardagsföremål — allt från fåglar och verktyg till frukter och fordon — och omvandlade dem till skarpa svartvita ”Mooney”-bilder. Dessa bilder behåller endast breda fält av mörkt och ljust och tar bort fina detaljer och skuggning. Mer än 900 volontärer tittade på bilderna online. För varje bild angav deltagarna först om de kunde identifiera föremålet och valde sedan ett namn från en lista. Avgörande var att varje tvetydig bild visades två gånger: en gång före och en gång efter att deltagarna kort fått se den ursprungliga, klara gråskaleversionen däremellan. Detta gjorde det möjligt för forskarna att följa hur perceptionen förändrades i takt med att människor fick mer information.

Vad gör en bild svår att se?

För att förstå varför vissa bilder kändes mer tvetydiga än andra använde forskarna ett hjärninspirerat artificiellt neuralt nätverk som efterliknar de visuella bearbetningsstegen i den mänskliga hjärnan. De jämförde hur lika varje klar bild och dess Mooney-motsvarighet såg ut för denna modell på olika nivåer, från enkel kantdetektion till komplex objektigenkänning. De fann att Mooney-transformationen främst skadade de högre nivåerna som bär information om vad föremålet är, medan lägre nivåers egenskaper som kanter och grova former var relativt bevarade. Bilder som behöll fler av dessa högre nivåers egenskaper var de som människor fann lättare att känna igen. Med andra ord är det som gör en bild förvirrande mindre förlusten av rå detalj och mer förlusten av den abstrakta struktur som signalerar ”det här är en hund” eller ”det här är en stol”.

Hur lärande förändrar vårt sätt att se

Att se den klara versionen av en bild — ”avtvetydigande” — hade en kraftfull effekt. Efteråt gick det snabbare och kändes säkrare för människor att säga att de kände igen Mooney-bilden, och de namngav den korrekt mycket oftare. Men också vilka egenskaper som spelade roll förändrades. Före avtvetydigandet berodde igenkänningen starkt på om bilden bevarade de där högre, objektlika mönstren. Efteråt spelade lägre nivåers visuella egenskaper såsom former och konturer en större roll. Det är som om, när människor väl sett svaret, började de matcha Mooney-bitarna av svart och vitt mot en nyinspelad intern mall från den klara bilden, och använde bildens finare struktur i stället för att gissa utifrån vaga intryck.

Från vilda gissningar till delad betydelse

Teamet undersökte också de ord människor använde för att namnge varje föremål. De mätte hur ”långt” varje etikett låg från det sanna föremålets betydelse i ett semantiskt rum byggt av språkdata, och hur varierade människors etiketter var för samma bild. Före avtvetydigandet var gissningarna spridda och inkonsekventa: vissa svar var löst relaterade (”häst” för ”zebra”), andra var helt fel. Efter att ha sett den klara bilden flyttade människors etiketter närmare den sanna betydelsen och blev mer lika varandra. Intressant nog förbättrade mängden information från den klara bilden inte igenkänningen längs en enkel rak linje. I stället visade det sig ett U-format mönster: människor presterade bäst antingen när den nya informationen starkt bekräftade vad de redan misstänkt eller när den tydligt omkullkastade en felaktig gissning. Måttliga, tvetydiga korrigeringar var mindre hjälpsamma.

Hur våra sinnen tämjer visuell förvirring

Denna studie tyder på att vi löser visuell förvirring genom en flexibel växelverkan mellan vida gissningar och precis matchning. Först lutar våra hjärnor sig på högre förväntningar: vi försöker passa vaga former till bekanta föremål. När vi väl får se svaret byter vi till att kontrollera om den exakta ordningen av kanter och fält matchar det föremål vi nu ”vet” finns där. Samtidigt blir vår mentala beskrivning av föremålet både skarpare och mer gemensam mellan människor. Slutsatsen att mer information inte alltid är bättre, och att tydlig bekräftelse eller tydlig motsägelse kan vara mest hjälpsamt, ger en rikare bild av hur vi utvinner betydelse ur ofullständiga vyer — en process som ligger i hjärtat av hur vi ser i en rörig, tvetydig verklighet.

Citering: Linde-Domingo, J., Ortiz-Tudela, J., Völler, J. et al. Determinants of visual ambiguity resolution. Commun Psychol 4, 78 (2026). https://doi.org/10.1038/s44271-026-00441-8

Nyckelord: visuell perception, tvetydighet, objektigenkänning, prediktiv bearbetning, Mooney-bilder