Clear Sky Science · fr

Une approche par ensemble guidée par des séries temporelles floues pour des prévisions précises des classements de l’enseignement supérieur

2026-03-13 · Retour à l’index

Pourquoi les classements universitaires de demain comptent aujourd’hui

Pour de nombreuses familles, choisir une université ressemble à un pari sur un avenir incertain. Des bouleversements mondiaux comme la pandémie de COVID‑19 peuvent soudainement perturber la vie sur les campus, les finances et la recherche, faisant basculer les palmarès familiers d’une année sur l’autre. Cette étude propose une nouvelle manière de prévoir ces classements qui cherche à intégrer, plutôt qu’à ignorer, cette incertitude — afin que les étudiants, les parents et les décideurs puissent fonder leurs choix sur des attentes réalistes et prospectives plutôt que sur des instantanés statiques.

Comment les classements sont devenus une cible mouvante

Les palmarès internationaux tels que le classement de Shanghai, le QS et le Times Higher Education orientent tout, des candidatures étudiantes aux financements publics. Ils reflètent des facteurs comme la qualité de l’enseignement, la production de recherche, les résultats étudiants et la présence internationale. Mais la pandémie a révélé la fragilité de ces mesures : les inscriptions ont chuté, les laboratoires ont fermé, les infrastructures numériques ont été mises à rude épreuve et les restrictions de voyage ont affaibli l’internationalisation. Les méthodes de prévision traditionnelles partent du principe que l’avenir ressemble beaucoup au passé, avec des schémas stables et des tendances régulières. Lorsque ces hypothèses échouent — comme ce fut le cas pendant le COVID — les prévisions peuvent induire en erreur, masquant les risques pour les établissements et pour les étudiants qui s’appuient sur les classements pour choisir où étudier.

Intégrer l’incertitude dans le calcul

Les auteurs proposent une méthode qui considère les classements non pas comme des points fixes mais comme des grandeurs floues et mouvantes. Plutôt que d’attribuer à chaque université un seul nombre net, le modèle répartit ce rang sur plusieurs bandes chevauchantes, reconnaissant qu’un établissement peut se trouver près de la limite entre des niveaux ou être particulièrement volatile lors d’années de crise. Les données récentes, en particulier celles affectées par la pandémie, pèsent davantage que les données lointaines, reflétant l’idée que les bouleversements récents importent plus pour demain que les événements d’il y a dix ans. Cette vision « floue » capte l’ambiguïté et les chocs à court terme d’une manière que les moyennes nettes ne peuvent pas saisir.

Regrouper les trajectoires similaires et élaguer les prédictions faibles

Pour transformer ce tableau plus flou en prévisions concrètes, le modèle groupe les universités qui ont des trajectoires de classement similaires dans le temps, incluant des clusters spécifiques pour les années de pandémie où de nombreux établissements ont subi des baisses ou des hausses soudaines. Au sein de chaque groupe, des machines de prédiction distinctes sont entraînées, chacune apprenant à partir d’un fragment légèrement différent de l’historique. Une étape dédiée d’élagage élimine ensuite les machines les plus faibles et les plus erratiques, ne conservant que les plus fiables et combinant leurs sorties. Cette approche par ensemble réduit le risque qu’un modèle trop confiant, ou qu’une année de données atypique, domine la prévision.

Tester le modèle sur l’éducation et au-delà

Les chercheurs ont évalué leur approche sur les données du classement mondial de Shanghai de 2008 à 2021, couvrant les périodes avant et après le COVID. Ils l’ont également testée sur d’autres séries temporelles — comme les cours boursiers, les mesures de la banquise, la qualité de l’air et les inscriptions étudiantes — pour vérifier si la méthode gérait différents types d’incertitude. Dans ces cas, leur ensemble a systématiquement produit des prévisions plus précises que plusieurs méthodes établies de séries temporelles floues. Pour les classements universitaires en particulier, le modèle a réduit l’erreur moyenne en pourcentage à environ 7 % et a correctement anticipé la direction du mouvement de classement — montée ou descente — dans plus de 80 % des cas.

De meilleures prévisions à des choix plus équitables

En termes simples, l’étude montre qu’il est possible de construire une prévision de classement qui « sait ce qu’elle ne sait pas ». En modélisant explicitement l’ambiguïté, les chocs soudains et l’importance accrue des événements récents, le système proposé offre des aperçus plus fiables de la direction prise par les universités, et pas seulement de leur passé. Cela peut aider les familles à éviter des réactions excessives face à des baisses ponctuelles, guider les établissements dans leurs investissements en préparation numérique ou en renforcement de la recherche, et éclairer les efforts publics pour développer une éducation de qualité et réduire les inégalités. Si aucun modèle ne peut rendre les classements parfaitement prévisibles, ce travail suggère qu’il est au moins possible de les prévoir d’une manière honnête vis-à-vis de l’incertitude — et plus utile pour les personnes dont l’avenir en dépend.

Citation: Agarwal, N., Tayal, D.K., Rajeena, P.P.F. et al. A fuzzy time-series driven ensemble approach for accurate forecasting of higher education rankings. Sci Rep 16, 13329 (2026). https://doi.org/10.1038/s41598-026-40570-y

Mots-clés: classements universitaires, prévision en éducation, séries temporelles floues, impact du COVID-19, apprentissage par ensemble