Clear Sky Science · fr
L’analyse automatique de la parole peut prédire la solitude
Entendre les émotions dans la conversation de tous les jours
La plupart d’entre nous savent ce que ressent la solitude, mais nous pensons rarement à ce à quoi elle pourrait ressembler à l’écoute. Cette étude pose une question frappante : des motifs subtils dans notre voix pourraient-ils révéler à quel point nous sommes seuls, même lorsque nous nous contentons de décrire une simple image ? En combinant analyse automatique de la parole et apprentissage automatique, les chercheurs explorent si un ordinateur peut détecter de minuscules indices vocaux que les gens ne remarquent pas, offrant ainsi une nouvelle fenêtre sur la déconnexion sociale et la santé émotionnelle.

Pourquoi la solitude compte pour la santé
La solitude n’est pas qu’un état passager ; elle est associée à un risque accru de dépression, d’anxiété, de psychose, d’idées suicidaires et même de décès prématuré. Les personnes qui se sentent chroniquement seules s’attendent souvent à de mauvaises rencontres sociales, prêtent davantage attention au rejet potentiel et peuvent adopter des comportements qui, sans le vouloir, éloignent les autres. Des travaux antérieurs ont montré que les personnes isolées peuvent être reconnues par des inconnus et des expérimentateurs, et que leurs réponses cérébrales et hormonales diffèrent lors de situations sociales. Tout cela suggère que la solitude laisse des traces dans notre comportement et notre façon de communiquer, y compris dans notre manière de parler.
Écouter attentivement un discours simple
L’équipe de recherche a recruté 96 adultes en bonne santé, à peu près répartis également entre femmes et hommes, avec un âge moyen d’environ 31 ans. Les participants ont rempli des questionnaires standard mesurant la solitude, la dépression et l’anxiété sociale. Ils ont ensuite réalisé trois courtes tâches orales pendant que leurs voix étaient enregistrées sur une tablette. Dans l’une d’elles, ils décrivaient une image bien connue d’une scène de cuisine familiale, qui incite doucement à parler de ce que font et pensent les autres. Dans les deux autres tâches, ils racontaient de courtes histoires sur un événement personnel positif et un événement négatif, choisis pour être émotionnellement significatifs mais non traumatiques.
Transformer la voix en données
Plutôt que d’analyser le sens des mots, les chercheurs se sont intéressés à la façon dont les participants parlaient. À l’aide d’un logiciel spécialisé, ils ont extrait automatiquement des dizaines de caractéristiques de chaque enregistrement. Celles-ci portaient sur le timing (par exemple la part de l’enregistrement occupée par la parole versus les silences), la mélodie et le rythme (comme les contours de la hauteur), la qualité sonore (par exemple la clarté ou le bruit de la voix) et les propriétés du signal acoustique. Des modèles d’apprentissage automatique, entraînés séparément pour les femmes et pour les hommes, ont tenté de prédire le score de solitude de chaque personne à partir de ces caractéristiques. Les résultats les plus prometteurs provenaient de la tâche structurée de description d’image, et non des récits émotionnels plus libres.

Ce que l’ordinateur a entendu
La parole issue de la description d’image a permis aux modèles de prédire la solitude mieux que le hasard, tant chez les femmes que chez les hommes, expliquant une part modeste mais significative des différences entre individus. Aucun trait vocal isolé ne portait le signal ; au contraire, de nombreux petits effets se combinaient pour former un motif détectable. Chez les femmes, une solitude plus élevée était liée à une parole moins continue (plus de silences par rapport à la parole) et à une intensité sonore plus irrégulière dans le temps. Chez les hommes, une solitude plus élevée s’associait à moins de pauses entre les syllabes, à un temps de parole global plus court, à une voix plus rugueuse et bruyante, et à une hauteur légèrement plus élevée. Lorsque la solitude était prédite en combinant les caractéristiques de la parole et les scores des questionnaires pour la dépression et l’anxiété sociale, le modèle combiné fonctionnait mieux que les seuls questionnaires pour les femmes, mais pas pour les hommes, ce qui suggère que le genre peut influencer la façon dont la solitude se manifeste dans la parole.
Contexte et limites des résultats
Fait intéressant, la parole provenant des tâches de récit émotionnel ne prédisait pas la solitude avec la même efficacité. Ces histoires ouvertes variaient largement dans leur contenu et suscitaient des émotions plus fortes, ce qui a probablement ajouté des changements vocaux supplémentaires masquant les motifs plus délicats liés à la solitude. La description d’image standardisée, en revanche, plaçait tout le monde dans une situation de pensée sociale similaire, rendant les différences subtiles plus faciles à détecter. Néanmoins, les modèles n’expliquaient qu’une partie du phénomène ; la solitude était également étroitement liée à la dépression et à l’anxiété sociale, et l’échantillon était composé majoritairement d’adultes jeunes et en bonne santé dont les expériences peuvent différer de celles de populations plus âgées ou cliniquement en difficulté.
Que cela signifie pour la vie quotidienne
En termes simples, l’étude montre que notre façon de parler — nos silences, notre hauteur et la qualité de notre voix — porte des indices faibles mais réels sur le degré de solitude que nous ressentons, même lorsque nous nous contentons de décrire une scène. Les ordinateurs peuvent saisir ces motifs en analysant des caractéristiques sonores que les humains remarquent rarement de façon consciente. Si les résultats actuels constituent une preuve de concept précoce plutôt qu’un test prêt à l’emploi, ils ouvrent la voie à un avenir où un bref discours quotidien pourrait aider à repérer des personnes à risque de solitude chronique et de problèmes de santé associés, idéalement pour orienter un soutien avant que l’isolement ne s’enracine profondément.
Citation: Immel, D., Mallick, E., Linz, N. et al. Automatic speech analysis can predict loneliness. Sci Rep 16, 11604 (2026). https://doi.org/10.1038/s41598-026-45965-5
Mots-clés: solitude, analyse de la parole, santé mentale, apprentissage automatique, connexion sociale