Clear Sky Science · pt
Fronteira perceptual da quantidade vocálica: um estudo perceptual de vogais árabes sintetizadas
Por que fatias minúsculas de tempo importam na fala
Quando ouvimos alguém falar árabe, raramente reparamos na duração de cada vogal. Ainda assim, pequenas diferenças temporais podem mudar completamente o significado de uma palavra — de modo semelhante à diferença entre “bit” e “beat” em inglês. Este artigo faz uma pergunta aparentemente simples: exatamente quanto tempo uma vogal precisa durar para que falantes nativos de dois grandes dialetos do árabe a percebam como “longa” em vez de “curta”? Ao responder isso, o estudo revela como nossos ouvidos segmentam o som contínuo nos blocos distintos que compõem a linguagem.

Sons curtos e longos que mudam o significado
O árabe usa o comprimento vocálico como parte central de seu sistema sonoro: pares como /a/ e um /aː/ mais longo podem distinguir palavras completamente diferentes. Trabalhos anteriores mediram quanto essas vogais tendem a durar na fala, mostrando que as vogais longas costumam ter entre uma vez e meia a três vezes a duração das curtas. Mas esses estudos focaram em como as vogais são produzidas, não em como são percebidas. Este estudo inverte a questão: em que ponto de um aumento gradual na duração os ouvintes passam a perceber uma vogal como longa em vez de curta — e esse ponto de mudança é o mesmo para falantes de diferentes dialetos árabes?
Dois dialetos sob o microscópio
O pesquisador comparou ouvintes do árabe najdi, falado na região central da Arábia Saudita, e do árabe cairene, o dialeto dominante do Cairo. Ambas as variedades compartilham o mesmo conjunto básico de três vogais curtas /a, i, u/ e três vogais longas /aː, iː, uː/. Para isolar puramente o fator tempo, o estudo usou gravações cuidadosamente editadas de três pares mínimos (por exemplo, uma palavra com vogal curta que significa “ele escreveu” versus uma com vogal longa que significa “ele correspondeu”). Partindo de vogais naturalmente longas, o autor foi gradualmente encurtando sua duração em pequenos passos, usando software que preservava a entonação e a qualidade sonora enquanto diminuía a vogal. Isso criou séries contínuas de vogais que iam de claramente longas a claramente curtas sem introduzir artefatos não naturais.
Ouvindo e escolhendo entre duas palavras
Quarenta participantes adultos — vinte falantes najdi e vinte falantes cairenes — completaram uma tarefa auditiva online. Após uma fase breve de familiarização com os pares de palavras originais e não modificados, cada pessoa ouviu as versões manipuladas uma a uma. Para cada item, tinham de decidir qual palavra ouviram: a versão com vogal longa ou a com vogal curta. Podiam reproduzir o som antes de responder, mas, uma vez dada a resposta, não podiam voltar atrás e alterá‑la. Utilizando modelos estatísticos que levam em conta tanto a palavra específica quanto o ouvinte individual, o pesquisador traçou como a probabilidade de uma resposta “longa” aumentava à medida que a vogal se tornava mais longa em milissegundos.
Onde os ouvintes traçam a linha no tempo
Os resultados mostram que a duração é uma pista poderosa para as três vogais, mas que a fronteira precisa entre curto e longo depende tanto do tipo de vogal quanto do dialeto. Para a vogal anterior fechada [i], os ouvintes cairenes começaram a perceber a vogal como longa em durações menores — cerca de 84 milissegundos — enquanto os ouvintes najdi tipicamente precisavam de cerca de 96 milissegundos antes de mudar para “longa”. Os ouvintes cairenes também alteraram seus julgamentos de forma mais abrupta ao longo da escala temporal, sugerindo uma fronteira mais nítida e categórica. Para a vogal baixa [a], ambos os grupos compartilhavam praticamente a mesma fronteira, próxima de 101 milissegundos, embora novamente os ouvintes cairenes apresentassem uma mudança mais inclinada e decisiva. Para a vogal posterior [u], as fronteiras foram muito próximas — cerca de 100 milissegundos para falantes najdi e 110 para falantes cairenes — e a pequena diferença não teve significado estatístico.

O que isso nos diz sobre ouvir a fala
Para um leigo, essas dezenas de milissegundos podem parecer triviais, mas elas mostram quão afinados nossos ouvidos estão aos padrões sonoros do próprio dialeto. O estudo indica que falantes najdi e cairenes concordam quanto ao tempo geral necessário para marcar uma vogal como longa, especialmente para [a] e [u], mas calibram esse tempo de forma diferente para [i]. Mostra também que há variação individual: alguns ouvintes tratam a mudança de curto para longo como um passo abrupto, outros como uma transição mais gradual. Em conjunto, esses achados apoiam a ideia de que categorias sonoras não são caixas rígidas e universais. Em vez disso, nossa experiência com um dialeto particular molda os limiares temporais exatos que o cérebro usa para transformar um fluxo contínuo de som em palavras com significado.
Citação: Alfaifi, A. Perceptual boundary of vowel quantity: a perceptual study of synthesized Arabic vowels. Humanit Soc Sci Commun 13, 271 (2026). https://doi.org/10.1057/s41599-025-06454-8
Palavras-chave: Vogais árabes, comprimento vocálico, percepção da fala, variação dialetal, fonética