Clear Sky Science · es

Datos a nivel de escena de películas de Amazon X-Ray en el mercado de EE. UU. combinados con IMDb

· Volver al índice

Por qué las escenas de cine importan para entender la cultura

Las películas moldean nuestra visión del mundo, pero la mayoría de las investigaciones sobre cine se han centrado en cifras de taquilla, géneros básicos o el poder de las estrellas, y no en lo que realmente ocurre en pantalla escena por escena. Este artículo presenta un nuevo conjunto de datos que permite a los investigadores acercarse hasta el nivel de escenas individuales, personajes y líneas de diálogo de más de tres mil películas emitidas en EE. UU. en Amazon Prime Video. Al combinar la función X-Ray de Amazon con la base de datos IMDb, los autores ofrecen un mapa detallado y estandarizado de quién aparece dónde y cuándo en cada film, lo que abre la puerta a estudios más ricos sobre representación, narración e incluso sistemas de inteligencia artificial que aprenden a partir de vídeo.

Figure 1
Figure 1.

De guiones preliminares a escenas terminadas

Hasta ahora, la mayoría de los estudios a gran escala sobre películas se han basado en guiones o archivos de subtítulos. Estas fuentes son útiles pero imperfectas. Los guiones suelen ser borradores tempranos que difieren del montaje final y pueden omitir personajes menores o cambios de edición posteriores. Los subtítulos recogen las líneas habladas pero no detectan personajes silenciosos, extras de fondo ni la narración puramente visual: por ejemplo, la cámara que se detiene en el rostro de un personaje. Debido a estas lagunas, los esfuerzos anteriores para rastrear quién interactúa con quién en pantalla o cómo se representan distintos grupos han tenido que deducirlo solo a partir del texto, lo que puede provocar errores en la identificación de personajes y sus relaciones.

Convertir X-Ray en datos listos para la investigación

La función X-Ray de Amazon ofrece una solución a estos problemas. Cuando los espectadores pausan una película, X-Ray muestra qué actores y personajes están actualmente en pantalla, información curada y vinculada directamente al montaje final. Los autores desarrollaron un proceso para extraer estos datos a nivel de escena de 3.265 películas disponibles en el catálogo de Prime Video de EE. UU. a agosto de 2023. Primero recopilaron todas las entradas de películas incluidas en Prime, filtraron las que no tenían información X-Ray y eliminaron duplicados causados por títulos repetidos o versiones alternativas. Para cada film restante, interceptaron los flujos de datos que el reproductor usa para cargar la información de X-Ray y los subtítulos, guardando los resultados en archivos estructurados que enumeran los límites de escena, los personajes presentes en cada escena y, para la mayoría de los títulos, la sincronización precisa de cada segmento de subtítulos.

Vincular las escenas con el mundo cinematográfico más amplio

El verdadero valor del conjunto de datos reside en conectar estos desgloses de escenas con información externa. Aunque X-Ray ya enlaza cada personaje con un perfil de IMDb, no incluye un ID de IMDb para la película en sí. Los autores diseñaron un algoritmo de emparejamiento que parte del título de la película, recupera varios candidatos en IMDb y luego compara el reparto principal de IMDb con los actores listados en los datos de X-Ray. Si al menos un actor importante coincide, la película se considera un emparejamiento. Este proceso automatizado acertó con la gran mayoría de las películas, y el equipo revisó manualmente los pocos cientos de casos límite restantes, corrigiendo clasificaciones erróneas y eliminando entradas que no eran películas narrativas, como espectáculos de stand-up. El resultado final es un conjunto de películas cuidadosamente depurado en el que cada escena, personaje y subtítulo puede vincularse a metadatos ricos como año, país y demografía del reparto.

Figure 2
Figure 2.

Qué pueden hacer los investigadores con estas películas

Porque cada escena tiene tiempos de inicio y fin claros y una lista de quién aparece, los investigadores pueden ahora construir mapas precisos de interacciones entre personajes y tiempo en pantalla. Los subtítulos alineados con las escenas permiten estudiar cómo varía el lenguaje según los personajes y los contextos, o cómo se desarrollan ciertos temas a través del diálogo. Al combinar este conjunto de datos con información adicional de IMDb y otras fuentes, los estudiosos pueden examinar preguntas como: ¿Cómo ha cambiado el equilibrio de género en pantalla a lo largo de las décadas? ¿Reciben los personajes de distintos orígenes la misma atención narrativa? ¿Cómo difieren los patrones de interacción entre géneros o países? El conjunto de datos también ofrece un punto de referencia de alta calidad para modelos de inteligencia artificial que aspiran a comprender contenido de vídeo, porque proporciona la verdad de referencia sobre quién es visible y cuándo.

Una nueva lente para las películas cotidianas

En términos sencillos, este trabajo convierte miles de películas en un catálogo buscable, escena por escena, de quién aparece, quién habla y cómo se estructuran las historias. Si bien la colección está limitada a títulos disponibles en Prime Video de EE. UU. y depende de los procesos internos de X-Ray de Amazon, aún abarca películas de muchas décadas y géneros, no solo ganadoras de premios famosas. Esa amplitud permite a los investigadores estudiar películas corrientes, no solo los clásicos que perduran en la memoria. A medida que el conjunto de datos se actualice y amplíe, promete profundizar nuestra comprensión de cómo el cine refleja la sociedad —y ofrecer a científicos sociales y tecnólogos una imagen más fiel de lo que realmente ocurre en pantalla.

Cita: Shrestha, S., Heo, Y., Barron, A.T.J. et al. Scene-level movie data from Amazon X-Ray in the US market combined with IMDb. Sci Data 13, 275 (2026). https://doi.org/10.1038/s41597-026-06602-y

Palabras clave: conjuntos de datos de películas, análisis a nivel de escena, Amazon X-Ray, metadatos de IMDb, representación en pantalla