Clear Sky Science · pt
Dados de filmes ao nível de cena do Amazon X-Ray no mercado dos EUA combinados com o IMDb
Por que as cenas de filmes importam para entender a cultura
Filmes moldam nossa visão de mundo, mas a maior parte das pesquisas sobre cinema tem se concentrado em bilheteria, gêneros básicos ou poder das estrelas, e não no que realmente acontece na tela cena a cena. Este artigo apresenta um novo conjunto de dados que permite aos pesquisadores aproximar-se do nível de cenas individuais, personagens e falas em mais de três mil filmes transmitidos nos EUA pelo Amazon Prime Video. Ao combinar o recurso X-Ray da Amazon com o Internet Movie Database (IMDb), os autores oferecem um mapa detalhado e padronizado de quem aparece onde e quando em cada filme, abrindo caminho para estudos mais ricos sobre representação, narrativa e até sistemas de inteligência artificial que aprendem a partir de vídeo.

De roteiros brutos a cenas finalizadas
Até agora, a maioria dos estudos em grande escala sobre filmes baseava-se em roteiros ou arquivos de legenda. Essas fontes são úteis, mas imperfeitas. Roteiros costumam ser rascunhos iniciais que diferem do corte final e podem omitir personagens menores ou alterações feitas na edição tardia. Legendas capturam falas, mas perdem personagens silenciosos, figurantes de fundo e a narrativa puramente visual — por exemplo, a câmera demorando no rosto de um personagem. Por causa dessas lacunas, esforços anteriores para rastrear quem interage com quem na tela, ou como diferentes grupos são representados, tiveram de deduzir a partir do texto, o que pode levar a erros na identificação de personagens e suas relações.
Transformando o X-Ray em dados prontos para pesquisa
O recurso X-Ray da Amazon oferece uma maneira de contornar esses problemas. Quando os espectadores pausam um filme, o X-Ray mostra quais atores e personagens estão atualmente na tela — informação que é curada e vinculada diretamente ao filme editado final. Os autores construíram um pipeline para coletar esses dados ao nível de cena para 3.265 filmes disponíveis no catálogo do Prime Video nos EUA em agosto de 2023. Primeiro reuniram todas as entradas de filmes incluídos no Prime, filtraram aqueles sem informação do X-Ray e removeram duplicatas causadas por títulos repetidos ou versões alternativas. Para cada filme restante, interceptaram os fluxos de dados usados pelo player para carregar informações do X-Ray e das legendas, salvando os resultados em arquivos estruturados que listam limites de cena, os personagens presentes em cada cena e, para a maioria dos títulos, o tempo preciso de cada segmento de legenda.
Ligando cenas ao mundo mais amplo do cinema
O verdadeiro poder do conjunto de dados vem de conectar esses recortes de cena a informações externas. Embora o X-Ray já vincule cada personagem a um perfil do IMDb, ele não inclui um ID do IMDb para o próprio filme. Os autores projetaram um algoritmo de correspondência que parte do título do filme, recupera vários candidatos do IMDb e então compara o elenco de maior destaque do IMDb com os atores listados nos dados do X-Ray. Se pelo menos um ator principal coincidir, o filme é tratado como correspondência. Esse processo automatizado acertou a grande maioria dos filmes, e a equipe então verificou manualmente as poucas centenas de casos problemáticos, corrigindo classificações erradas e removendo entradas que na verdade não eram filmes narrativos, como especiais de stand-up. O resultado final é um conjunto cuidadosamente limpo de filmes onde cada cena, personagem e legenda pode ser ligada a metadados ricos, como ano, país e demografia do elenco.

O que os pesquisadores podem fazer com esses filmes
Como cada cena tem início e fim claros e uma lista de quem aparece, pesquisadores agora podem construir mapas precisos de interações entre personagens e tempo de tela. Legendas alinhadas com cenas tornam possível estudar como a linguagem difere entre personagens e contextos, ou como certos temas se desenvolvem através dos diálogos. Ao combinar esse conjunto de dados com informações adicionais do IMDb e outras fontes, estudiosos podem examinar questões como: como o equilíbrio de gênero na tela mudou ao longo das décadas? Personagens de diferentes origens recebem atenção narrativa igual? Como padrões de interação variam entre gêneros ou países? O conjunto de dados também oferece um benchmark de alta qualidade para modelos de inteligência artificial que buscam entender conteúdo de vídeo, porque fornece verdade de base sobre quem está visível e quando.
Uma nova lente para filmes do cotidiano
Em termos simples, este trabalho transforma milhares de filmes em um catálogo pesquisável, cena por cena, de quem aparece, quem fala e como as histórias são estruturadas. Embora a coleção seja limitada a títulos disponíveis no Prime Video dos EUA e dependa dos processos internos do X-Ray da Amazon, ela ainda cobre filmes de muitas décadas e gêneros, não apenas os premiados e famosos. Essa amplitude permite que pesquisadores estudem filmes do cotidiano, não apenas os clássicos que permanecem na memória. À medida que o conjunto de dados for atualizado e ampliado, promete aprofundar nossa compreensão de como os filmes refletem a sociedade — e oferecer tanto a cientistas sociais quanto a tecnólogos uma imagem mais fiel do que realmente acontece na tela.
Citação: Shrestha, S., Heo, Y., Barron, A.T.J. et al. Scene-level movie data from Amazon X-Ray in the US market combined with IMDb. Sci Data 13, 275 (2026). https://doi.org/10.1038/s41597-026-06602-y
Palavras-chave: conjuntos de dados de filmes, análise ao nível de cena, Amazon X-Ray, metadados do IMDb, representação na tela