Clear Sky Science · de
Fortbildung der Data‑Science‑Forschungsausbildung in Afrika durch datathon‑gesteuerte Innovationen
Warum das für die Gesundheit in Afrika wichtig ist
In ganz Afrika sammeln Forschende riesige Mengen an Gesundheitsdaten – von Klinikbesuchen über Mückenzählungen bis hin zu Satellitenbildern. Ohne Menschen mit der Fähigkeit, diese Daten zu verstehen, bleiben viele lebensrettende Erkenntnisse jedoch ungenutzt. Dieser Artikel beschreibt einen neuen Weg, um junge Wissenschaftlerinnen und Wissenschaftler in Westafrika schnell auszubilden: über „Datathons“ – intensive, teamorientierte Veranstaltungen, bei denen Teilnehmende reale Malariadaten analysieren und ihre Arbeit in veröffentlichungsfähige Forschung überführen. Der Ansatz zeigt, wie kurze, fokussierte Programme lokale Expertise stärken und dafür sorgen können, dass afrikanische Daten zur Lösung afrikanischer Gesundheitsprobleme genutzt werden.
Eine neue Art von Lernveranstaltung
Die Autorinnen und Autoren entwickelten unter der Initiative Data Science for Health Discovery and Innovation in Africa ein zweiphasiges Trainingsmodell. Zuerst fand eine hybride „Foundation Week“ statt, offen für etwa 50 Teilnehmende aus 14 Ländern, von denen viele remote teilnahmen. In dieser Phase lernten die Trainees Programmierung, Datenmanagement und grundlegende Analysefähigkeiten mit frei verfügbaren oder weit verbreiteten Werkzeugen wie R, Python und Kartenprogrammen. Der Fokus lag auf praktischer Übung statt Vorlesungen – mit Aufgaben, die die Teilnehmenden Schritt für Schritt durch echte Analyseaufgaben führten. Wer die meisten Sitzungen absolvierte, erhielt ein Zertifikat und war für die zweite, persönliche Phase qualifiziert.

Statistik in intelligentere Werkzeuge verwandeln
Die meisten Teilnehmenden kannten bereits traditionelle Statistik, sodass die Lehrenden dieses Vorwissen nutzten, um zu neueren Methoden überzuleiten, die oft unter künstlicher Intelligenz und maschinellem Lernen zusammengefasst werden. Anstatt diese als mysteriöse „Black Boxes“ zu behandeln, zeigte die Schulung, wie sie aus vertrauten Ideen entstehen. Ein Fallbeispiel verglich etwa die einfache lineare Regression – ein Grundpfeiler der Statistik – mit einer maschinellen Lern‑artigen Regression, die Daten in Trainings‑ und Testmengen aufteilt und Kreuzvalidierung zur Leistungsbewertung nutzt. Eine andere Übung stellte das manuelle Nachzeichnen von Objekten auf Satellitenbildern dem automatisierten Bildklassifizieren gegenüber, das Hausdächer deutlich schneller und genauer erkennen kann. Diese Gegenüberstellungen halfen den Teilnehmenden zu erkennen, wann klassische Techniken angemessen sind und wann maschinelles Lernen echten Mehrwert bietet.
Blick in den Datathon
Nach der Foundation‑Phase reisten 15 Trainees nach Bamako, Mali, zu einem fünftägigen Präsenz‑Datathon in einem spezialisierten Bioinformatikzentrum. Sie arbeiteten mit einem umfangreichen Malaria‑Datenlager, das aus einer langjährigen Studie in Mali, Senegal und Gambia aufgebaut worden war und über Jahre hinweg Tausende von Personen, Haushalten, Mücken und Klinikbesuchen verfolgte. Die Teilnehmenden wurden in fünf kleine Teams eingeteilt, die Programmier‑, Epidemiologie‑ und klinische Fähigkeiten kombinierten. Unter Anleitung von Mentorinnen und Mentoren wählte jede Gruppe eine eigene Forschungsfrage – etwa warum einige Kinder den Malariaparasit ohne Symptome tragen oder wie sich Malariarisiken je nach Saison und Ort verändern – und bereinigte, verknüpfte und analysierte die entsprechenden Datenebenen.

Von der intensiven Woche zur nachhaltigen Wirkung
Während der Woche präsentierten die Teams täglich ihren Fortschritt vor einer Jury, die die Projekte nach wissenschaftlicher Qualität und Methodik bewertete. Am Ende hielten die Gruppen Schlussvorträge und reichten schriftliche Berichte ein; Preise zeichneten Spitzenleistungen aus. Entscheidenderweise endete der Datathon nicht mit der Veranstaltung selbst. Jedes Team wurde einer erfahrenen Mentorin bzw. einem erfahrenen Mentor zugeordnet und nahm an einem rotierenden Plan von Online‑Treffen teil, um das Projekt innerhalb von etwa einem Jahr in ein vollständiges wissenschaftliches Papier zu überführen. Das Programm hob auch reale Herausforderungen hervor: die Organisation internationaler Reisen, das Überwinden von Sprachbarrieren zwischen Englisch und Französisch sowie die Chancengleichheit für Wissenschaftlerinnen, sich zu bewerben, teilzunehmen und Teams zu leiten. Trotz dieser Hürden berichteten Teilnehmende von hoher Motivation und Freude, und die Autorinnen und Autoren verzeichnen starke Vernetzung und Zusammenarbeit über Ländergrenzen hinweg.
Was das für die Zukunft bedeutet
Die Studie zeigt, dass gut geplante Datathons weit mehr leisten können als nur einen kurzen Kodier‑Crashkurs. Durch die Kombination aus strukturierter Vorbereitung, Zugang zu hochwertigen lokalen Gesundheitsdaten und anhaltender Betreuung ermöglicht das Modell jungen afrikanischen Forschenden, durch das Tun echte Wissenschaft zu betreiben, die für ihre Gemeinschaften relevant ist. Die Autorinnen und Autoren argumentieren, dass ähnliche Programme auf andere Krankheiten und Regionen übertragbar sind, insbesondere dort, wo Universitäten oder Krankenhäuser bereits über grundlegende Rechenausstattung verfügen. Langfristig können solche Initiativen ungenutzte Daten in Evidenz für bessere Gesundheitspolitik verwandeln und gleichzeitig eine neue Generation datenbewanderter Wissenschaftlerinnen und Wissenschaftler auf dem gesamten Kontinent aufbauen.
Zitation: Doumbia, S., Kane, F., Diabate, O. et al. Advancing data science research education in Africa through datathon-driven innovations. Sci Rep 16, 11527 (2026). https://doi.org/10.1038/s41598-026-41474-7
Schlüsselwörter: Datathon‑Schulung, Gesundheitsdatenwissenschaft, Malariaforschung, Kapazitätsaufbau in Afrika, Maschinelles Lernen Ausbildung