Clear Sky Science · fr

Faire progresser la formation en recherche en science des données en Afrique grâce à des innovations issues de datathons

· Retour à l’index

Pourquoi c’est important pour la santé en Afrique

À travers l’Afrique, les chercheurs collectent d’énormes quantités d’informations sanitaires, des visites en clinique aux comptages de moustiques en passant par les images satellitaires. Pourtant, sans personnes formées pour interpréter ces données, de nombreuses découvertes potentiellement salvatrices restent inutilisées. Cet article décrit une nouvelle manière de former rapidement de jeunes scientifiques en Afrique de l’Ouest via des « datathons » : des événements intensifs en équipe où les participants analysent des données réelles sur le paludisme et transforment leur travail en recherches publiables. L’approche montre comment des programmes courts et ciblés peuvent renforcer l’expertise locale et aider à garantir que les données africaines servent à résoudre des problèmes de santé africains.

Un nouveau type d’événement pédagogique

Les auteurs ont conçu un modèle de formation en deux phases dans le cadre de l’initiative Data Science for Health Discovery and Innovation in Africa. La première phase était une « semaine de base » hybride, ouverte à environ 50 participants venant de 14 pays, dont beaucoup ont participé à distance. Durant cette phase, les stagiaires ont appris le codage, la gestion de données et des compétences analytiques de base en utilisant des outils libres ou largement disponibles tels que R, Python et des logiciels de cartographie. L’accent était mis sur la pratique plutôt que sur les cours magistraux, avec des exercices guidant pas à pas les participants à travers des tâches analytiques réelles. Ceux qui ont suivi la plupart des sessions ont obtenu un certificat et sont devenus éligibles pour la seconde phase en présentiel.

Figure 1
Figure 1.

Transformer les statistiques en outils plus intelligents

La plupart des participants maîtrisaient déjà certaines notions de statistique traditionnelle, si bien que les instructeurs s’en sont servis comme passerelle vers des méthodes plus récentes souvent regroupées sous l’étiquette intelligence artificielle et apprentissage automatique. Plutôt que de présenter ces méthodes comme des « boîtes noires » mystérieuses, la formation a montré comment elles découlent d’idées familières. Par exemple, une étude de cas a comparé la régression linéaire ordinaire — un pilier de la statistique — à une régression de type apprentissage automatique qui divise les données en jeux d’entraînement et de test et utilise la validation croisée pour évaluer les performances. Un autre exercice a confronté le traçage manuel d’objets sur des images satellitaires à des méthodes automatisées de classification d’images capables d’identifier les toitures beaucoup plus rapidement et avec plus de précision. Ces démonstrations côte à côte ont aidé les participants à discerner quand utiliser des techniques classiques et quand l’apprentissage automatique apporte une valeur ajoutée réelle.

Dans le datathon

Après la phase de base, 15 stagiaires se sont rendus à Bamako, au Mali, pour un datathon en présentiel de cinq jours organisé dans un centre spécialisé en bioinformatique. Ils ont travaillé avec un riche entrepôt de données sur le paludisme construit à partir d’une étude de longue durée menée au Mali, au Sénégal et en Gambie, qui suivait des milliers de personnes, de ménages, de moustiques et de visites en clinique sur plusieurs années. Les participants ont été répartis en cinq petites équipes mélangeant compétences en programmation, épidémiologie et pratique clinique. Sous la conduite de mentors, chaque groupe a choisi sa propre question de recherche — par exemple pourquoi certains enfants portent le parasite du paludisme sans symptômes, ou comment le risque de paludisme évolue selon les saisons et les lieux — puis a nettoyé, relié et analysé les couches de données pertinentes.

Figure 2
Figure 2.

D’une semaine intense à un impact durable

Tout au long de la semaine, les équipes ont présenté quotidiennement leurs progrès à des juges qui notaient les projets selon la qualité scientifique et les méthodes. En fin de session, les groupes ont présenté des exposés finaux et des rapports écrits, et des prix ont récompensé les meilleures performances. Surtout, le datathon ne s’est pas arrêté à la fin de l’événement. Chaque équipe a été jumelée à un mentor senior et a rejoint un calendrier rotatif de réunions en ligne pour transformer son projet en article scientifique complet en l’espace d’environ un an. Le programme a aussi mis en lumière des défis concrets : la coordination des voyages internationaux, la gestion des barrières linguistiques entre anglophones et francophones, et l’accès équitable des femmes scientifiques aux candidatures, à la participation et au leadership des équipes. Malgré ces obstacles, les participants ont signalé un fort engagement et du plaisir, et les auteurs notent un solide réseautage et une collaboration entre pays.

Ce que cela signifie pour l’avenir

Cette étude montre que des datathons bien conçus peuvent faire bien plus qu’un simple stage intensif de codage. En combinant une préparation structurée, l’accès à des données sanitaires locales de haute qualité et un mentorat soutenu, le modèle permet aux jeunes chercheurs africains d’apprendre en faisant de la science réelle qui a de l’importance pour leurs communautés. Les auteurs soutiennent que des programmes similaires pourraient être adaptés à d’autres maladies et régions, en particulier là où les universités ou les hôpitaux disposent déjà d’infrastructures informatiques de base. À long terme, de tels efforts peuvent transformer des données sous‑utilisées en preuves pour de meilleures politiques de santé, tout en formant une nouvelle génération de scientifiques maîtrisant les données à travers le continent.

Citation: Doumbia, S., Kane, F., Diabate, O. et al. Advancing data science research education in Africa through datathon-driven innovations. Sci Rep 16, 11527 (2026). https://doi.org/10.1038/s41598-026-41474-7

Mots-clés: formation datathon, science des données en santé, recherche sur le paludisme, renforcement des capacités en Afrique, formation en apprentissage automatique