Clear Sky Science · fr

Une approche de vraisemblance pour inférer l'hétérogénéité de population dans des ensembles de particules avec dynamique de Langevin du second ordre

· Retour à l’index

Pourquoi de petits mouvements peuvent révéler de grands secrets

Des bactéries vagabondes aux cellules errantes dans notre organisme, les êtres vivants bougent rarement exactement de la même manière. Chaque individu a ses propres particularités, et les expériences n’enregistrent souvent que de courts extraits bruités de leur mouvement. Cette étude montre comment transformer ces trajectoires fragmentées en un tableau clair de la diversité réelle d’une population, à l’aide d’un outil statistique qui fonctionne même lorsque le mouvement semble aléatoire et que seules les positions, et non les vitesses, sont mesurées.

Observer de nombreux petits voyageurs

Les microscopes et caméras modernes peuvent suivre des essaims de cellules, de microorganismes ou d’autres « particules actives » alors qu’ils rampent, nagent ou glissent. Mais en pratique, chaque cellule peut disparaître du champ de vision au bout d’un court instant parce qu’elle sort du champ ou est masquée par ses voisines. Plutôt que quelques longs films d’un même individu, les scientifiques se retrouvent avec de nombreuses trajectoires courtes provenant de particules différentes. De plus, même des microbes ou des cellules génétiquement identiques ne se déplacent pas de façon identique : certains sont plus persistants, d’autres plus erratiques, et certains réagissent différemment à leur environnement. Ignorer cette individualité peut conduire à des conclusions trompeuses sur le comportement du groupe dans son ensemble.

Des trajectoires aléatoires aux règles cachées
Figure 1. De nombreuses particules en mouvement produisent des trajectoires courtes qui révèlent un schéma sous-jacent de diversité dans leur mouvement.
Figure 1. De nombreuses particules en mouvement produisent des trajectoires courtes qui révèlent un schéma sous-jacent de diversité dans leur mouvement.

Pour comprendre de tels mouvements, les chercheurs les décrivent souvent avec des modèles de « Langevin » : des règles mathématiques qui traitent le mouvement comme la combinaison de tendances régulières et de chocs aléatoires. Pour de nombreux systèmes actifs, il ne suffit pas d’examiner les seuls changements de position, car les vitesses sous-jacentes fluctuent dans le temps et introduisent une mémoire dans le mouvement. Cela rend les positions observées non markoviennes, ce qui signifie que le pas suivant dépend de plus que du seul état actuel. Les approches standard qui estiment les paramètres du modèle à partir des changements d’un pas à l’autre peuvent alors être biaisées, surtout lorsque seules les positions sont mesurées et que les vraies vitesses restent cachées. Les auteurs montrent que les méthodes naïves peuvent systématiquement mal estimer des quantités clés telles que la rapidité de changement de direction des particules ou l’intensité des chocs aléatoires.

Une manière plus intelligente de lire des données bruitées

Le cœur de l’article est une nouvelle façon d’approcher la vraisemblance d’un jeu de paramètres du modèle, étant donné une trajectoire enregistrée. Plutôt que de supposer que des vitesses approximées par différences finies se comportent comme des vitesses instantanées véritables, la méthode tient compte avec soin du fait que le mouvement observé a été lissé sur de courtes fenêtres temporelles. Mathématiquement, cela conduit à une description où ces « vitesses sécantes » sont entraînées par un bruit coloré présentant des corrélations à court terme spécifiques. En capturant ces corrélations dans une matrice compacte à structure simple, les auteurs dérivent une formule de vraisemblance qui peut être évaluée rapidement, même pour de longues trajectoires comportant de nombreux points de données.

Prendre de la hauteur, des individus aux populations
Figure 2. Des trajectoires courtes et bruitées se combinent en un profil de population plus net en pondérant tous les paramètres de mouvement possibles par leur vraisemblance.
Figure 2. Des trajectoires courtes et bruitées se combinent en un profil de population plus net en pondérant tous les paramètres de mouvement possibles par leur vraisemblance.

Une fois qu’ils peuvent écrire la vraisemblance d’une trajectoire individuelle pour un ensemble donné de paramètres, les auteurs vont plus loin et laissent ces paramètres varier d’une particule à l’autre. Ils considèrent l’ensemble de la population comme issu d’une distribution inconnue et cherchent quelle distribution explique au mieux toutes les trajectoires observées simultanément. Pour résoudre ce problème, ils utilisent un schéma expectation–maximization, qui alterne entre estimer la probabilité de différentes valeurs de paramètres pour chaque trajectoire et mettre à jour la distribution globale de la population. Cette approche de « vraisemblance complète » surpasse des méthodes plus simples en deux étapes qui ajustent d’abord chaque trajectoire séparément puis ajustent une distribution à ces estimations ponctuelles, en particulier lorsque les trajectoires sont courtes et que l’incertitude sur chaque individu est élevée.

Savoir à quel point nous sommes sûrs

Au-delà de fournir une estimation optimale de la variabilité de la population, le cadre offre aussi un moyen de quantifier l’incertitude de cette estimation. En examinant la netteté de la vraisemblance autour de son maximum, les auteurs calculent une matrice Hessienne dont l’inverse estime la dispersion attendue des paramètres de population inférés d’une expérience à l’autre. Cela fournit des régions de confiance montrant à quel point la distribution inférée pourrait varier en raison d’un volume de données fini. Des tests sur des données simulées, y compris des modèles de particules actives avec vitesses préférentielles et tendances rotationnelles, montrent que la méthode récupère de manière fiable l’hétérogénéité imposée à mesure que l’échantillonnage devient plus fin et que les trajectoires s’allongent.

Ce que cela signifie pour l’étude du mouvement vivant

En termes simples, l’article propose une méthode pour dissocier deux sources d’aléa dans les données de mouvement : les fluctuations aléatoires de chaque individu au fil du temps et les différences réelles entre les individus d’une population. En traitant correctement les trajectoires courtes ne contenant que des positions et les vitesses cachées qui les sous-tendent, la méthode donne une image plus nette et plus honnête de la diversité d’un groupe de particules ou de cellules en mouvement, ainsi que du degré de confiance que l’on peut avoir dans cette image. Cela ouvre la voie à des modèles plus détaillés et basés sur les données de systèmes motiles complexes, des cellules en migration dans les tissus aux particules autopropulsées dans des matériaux conçus.

Citation: Albrecht, J., Opper, M. & Großmann, R. A Likelihood Approach for Inference of Population Heterogeneity in Particle Ensembles with Second-Order Langevin Dynamics. Commun Phys 9, 165 (2026). https://doi.org/10.1038/s42005-026-02670-z

Mots-clés: matière active, motilité cellulaire, modélisation stochastique, hétérogénéité de population, analyse de trajectoire