Clear Sky Science · es

El Conjunto de Datos de Contenido Semántico Mínimo (MSC): Un Recurso Grande y Equilibrado para la Investigación en Estética Computacional

· Volver al índice

Por qué la belleza en las imágenes es más difícil de medir de lo que parece

¿Por qué algunas fotos nos parecen bellas mientras que otras resultan aburridas o incluso feas? Podrías pensar que los científicos pueden responder midiendo colores, contraste o patrones en una imagen. Pero hay un problema: nuestras reacciones están enredadas con lo que muestra la imagen—personas, lugares, símbolos y recuerdos. Este artículo presenta una nueva colección de imágenes cuidadosamente diseñada que intenta eliminar esas distracciones para que los investigadores puedan centrarse en cómo responden el ojo y el cerebro al aspecto puro de una imagen.

Quitando la historia de la imagen

La mayoría de las bases de datos de imágenes populares usadas en la investigación se construyen a partir de sitios de intercambio de fotos y concursos en línea. Estas fuentes llevan títulos, temas y referencias culturales que influyen discretamente en cómo la gente las valora. Un chiste inteligente que encaja con la temática de un concurso puede hacer que una foto mediocre gane. Símbolos potentes, como banderas, pueden obtener puntuaciones altas por razones culturales en lugar de visuales. Además, la gente rara vez sube fotos realmente malas, así que las bases de datos existentes están llenas de imágenes que son decentes o mejores. En conjunto, esto dificulta mucho saber si una puntuación alta proviene de la construcción visual de una imagen—sus colores, texturas y formas—o de su significado.

Figure 1
Figura 1.

Construyendo un mundo de escenas silenciosas

Para abordar esto, los autores crearon la base de datos Minimum Semantic Content (MSC): más de diez mil imágenes elegidas para ser visualmente ricas pero con la menor “historia” posible. Empezaron con fotos de dominio público y colecciones personales, y luego eliminaron cualquier imagen con personas, animales, edificios, texto u objetos simbólicos fuertes. También evitaron vistas tipo postal que puedan evocar recuerdos o emociones intensas. Lo que queda son mayormente fragmentos de la naturaleza—hojas, corteza, rocas, nubes, superficies de agua y suelos de bosque. Estas escenas no son completamente carentes de significado, pero son mucho más uniformes en su materia. Eso hace que las diferencias en los juicios de la gente sean más probables que provengan de cualidades visuales como el color, la luz y la estructura, en lugar de quién o qué aparece.

Inventando una herramienta para crear belleza y fealdad a demanda

Incluso con este filtrado cuidadoso, la colección inicial tendía a imágenes agradables. Para obtener un control científico sólido sobre la belleza, los investigadores necesitan muchos ejemplos distribuidos uniformemente desde muy feo hasta muy bello. Por eso el equipo creó un programa de edición simple apodado el “Uglifier” (Embellecedor/Fealdador). Cuarenta voluntarios lo usaron para empujar imágenes seleccionadas en dos direcciones: hacerlas tan bellas como fuera posible, o tan feas como fuera posible, ajustando deslizadores de brillo, contraste, mezcla de color, nitidez, ruido, recorte y algunas transformaciones avanzadas. Los investigadores también registraron algunas de estas «recetas» de edición y las aplicaron automáticamente a otras imágenes, añadiendo un gran lote de variantes “feas” adicionales. Esto produjo una mezcla amplia de originales, embellecidas, afea-das y afea-das automáticamente.

Pidiendo a miles de personas que voten con la vista

A continuación, los autores recurrieron a una plataforma de crowdsourcing integrada en un juego en línea, reclutando a más de diez mil jugadores de todo el mundo. Cada imagen del conjunto MSC se mostró a cien espectadores no expertos diferentes, que valoraron su belleza en una sencilla escala de cinco puntos desde muy fea hasta muy bella. Ejemplos de entrenamiento en los extremos ayudaron a las personas a usar todo el rango de la escala. Controles de calidad cuidadosos eliminaron a jugadores que parecían hacer clic al azar. El resultado final es una colección de imágenes donde cada escena cuenta con un historial de valoraciones rico, y donde las imágenes feas, medias y bellas están bien representadas en lugar de agruparse en el centro.

Lo que esto revela sobre la belleza y la estructura visual

Con este conjunto equilibrado en mano, el equipo examinó cómo decenas de propiedades básicas de la imagen—como contraste, variabilidad de color, densidad de bordes, simetría y textura tipo fractal—se relacionan con las valoraciones de belleza. Encontraron que cuando las puntuaciones se distribuyen uniformemente a lo largo del rango feo–bello, las conexiones entre estas propiedades de bajo nivel y los juicios de las personas se vuelven más claras y a menudo más fuertes. En algunos casos, la dirección de la relación incluso se invierte en comparación con lo observado en bases de datos anteriores y sesgadas. También comprobaron si el Uglifier producía un tipo estrecho y artificial de fealdad; en su lugar, las imágenes editadas resultaron compartir estadísticas básicas similares con originales naturalmente mal valorados, lo que sugiere que las manipulaciones capturaron tendencias visuales reales más que extremos caricaturescos.

Figure 2
Figura 2.

Por qué esto importa para entender el gusto

Para un lector no especializado, la conclusión es que los científicos ahora pueden estudiar el gusto visual de una manera más limpia. La base de datos MSC ofrece un mundo de escenas tranquilas, mayormente naturales, donde la belleza y la fealdad dependen principalmente de cómo se ven las cosas, no de quién o qué representan. Esto la convierte en un banco de pruebas potente para la psicología, la neurociencia y la investigación en inteligencia artificial que pretende predecir la preferencia estética a partir de la estructura de las imágenes por sí sola. Más adelante, se podrá volver a añadir significado y contexto cultural más complejos. Empezando por imágenes que dicen muy poco y que lucen muy distintas, el proyecto MSC ayuda a aclarar cuánto de nuestro sentido de la belleza surge del ojo antes de que la mente añada sus historias.

Cita: Penacchio, O., Javed, A., Raducanu, B. et al. The Minimum Semantic Content (MSC) Dataset: A Large, Balanced Resource for Computational Aesthetics Research. Sci Data 13, 470 (2026). https://doi.org/10.1038/s41597-026-06816-0

Palabras clave: estética visual, base de datos de imágenes, valoraciones crowdsourced, belleza computacional, texturas naturales