Clear Sky Science · pt

Avançando o ensino de pesquisa em ciência de dados na África por meio de inovações impulsionadas por datathons

· Voltar ao índice

Por que isto importa para a saúde na África

Em toda a África, pesquisadores estão coletando enormes volumes de informações de saúde, desde visitas a clínicas até contagens de mosquitos e imagens de satélite. No entanto, sem pessoas capacitadas para interpretar esses dados, muitos insights que podem salvar vidas permanecem inacessíveis. Este artigo descreve um novo modo de treinar rapidamente jovens cientistas na África Ocidental usando “datathons” — eventos intensivos em equipe nos quais os participantes analisam dados reais sobre malária e transformam seu trabalho em pesquisas publicáveis. A abordagem demonstra como programas curtos e focados podem aumentar a expertise local e ajudar a garantir que os dados africanos sejam usados para resolver problemas de saúde africanos.

Um novo tipo de evento de aprendizagem

Os autores conceberam um modelo de treinamento em duas fases no âmbito da iniciativa Data Science for Health Discovery and Innovation in Africa. Primeiro houve uma “semana de fundamentos” híbrida, aberta a cerca de 50 participantes de 14 países, muitos participando remotamente. Nessa fase, os participantes aprenderam programação, gestão de dados e habilidades analíticas básicas usando ferramentas gratuitas ou amplamente disponíveis, como R, Python e softwares de mapeamento. O foco foi na prática hands‑on em vez de palestras, com exercícios que conduziam os participantes passo a passo por tarefas analíticas reais. Aqueles que completaram a maioria das sessões receberam um certificado e tornaram‑se elegíveis para a segunda fase presencial.

Figure 1
Figure 1.

Transformando estatística em ferramentas mais inteligentes

A maioria dos participantes já conhecia alguma estatística tradicional, de modo que os instrutores usaram essa familiaridade como ponte para métodos mais recentes frequentemente agrupados sob inteligências artificial e aprendizado de máquina. Em vez de tratar esses métodos como “caixas‑pretas” misteriosas, o treinamento mostrou como eles decorrem de ideias familiares. Por exemplo, um estudo de caso comparou a regressão linear comum — um pilar da estatística — com uma regressão no estilo aprendizado de máquina que separa os dados em conjuntos de treino e teste e usa validação cruzada para verificar o desempenho. Outro exercício comparou traçar manualmente objetos em imagens de satélite com métodos automatizados de classificação de imagens que identificam telhados de casas muito mais rapidamente e com maior precisão. Essas demonstrações lado a lado ajudaram os participantes a ver quando usar técnicas clássicas e quando o aprendizado de máquina agrega valor real.

Dentro do datathon

Após a fase de fundamentos, 15 participantes viajaram para Bamako, no Mali, para um datathon presencial de cinco dias realizado em um centro especializado de bioinformática. Eles trabalharam com um rico armazém de dados sobre malária construído a partir de um estudo de longa duração no Mali, Senegal e Gâmbia que acompanhou milhares de pessoas, domicílios, mosquitos e visitas a clínicas ao longo de vários anos. Os participantes foram organizados em cinco pequenas equipes que mesclavam habilidades em programação, epidemiologia e prática clínica. Guiados por mentores, cada grupo escolheu sua própria pergunta de pesquisa — como por que algumas crianças carregam o parasita da malária sem sintomas, ou como o risco de malária muda ao longo de estações e locais — e então limpou, vinculou e analisou as camadas de dados relevantes.

Figure 2
Figure 2.

Da semana intensa a um impacto duradouro

Ao longo da semana, as equipes apresentaram progressos diários a juízes que pontuavam os projetos quanto à qualidade científica e aos métodos. Ao fim, os grupos fizeram apresentações finais e entregaram relatórios escritos, e prêmios reconheceram as melhores atuações. Crucialmente, o datathon não terminou quando o evento acabou. Cada equipe foi pareada com um mentor sênior e entrou em uma agenda rotativa de reuniões online para transformar seu projeto em um artigo científico completo em cerca de um ano. O programa também destacou desafios do mundo real: coordenar viagens internacionais, lidar com barreiras linguísticas entre falantes de inglês e francês e garantir que cientistas mulheres tivessem chances iguais de se inscrever, participar e liderar equipes. Apesar desses obstáculos, os participantes relataram alto engajamento e satisfação, e os autores notam forte networking e colaboração entre países.

O que isto significa para o futuro

Este estudo mostra que datathons bem planejados podem fazer muito mais do que oferecer um curso intensivo de programação. Ao combinar preparação estruturada, acesso a dados locais de saúde de alta qualidade e mentoria contínua, o modelo ajuda jovens pesquisadores africanos a aprender fazendo ciência real que importa para suas comunidades. Os autores argumentam que programas semelhantes podem ser adaptados para outras doenças e regiões, especialmente onde universidades ou hospitais já dispõem de infraestrutura computacional básica. A longo prazo, tais esforços podem transformar dados subutilizados em evidências para políticas de saúde melhores, ao mesmo tempo em que formam uma nova geração de cientistas com domínio de dados em todo o continente.

Citação: Doumbia, S., Kane, F., Diabate, O. et al. Advancing data science research education in Africa through datathon-driven innovations. Sci Rep 16, 11527 (2026). https://doi.org/10.1038/s41598-026-41474-7

Palavras-chave: treinamento em datathon, ciência de dados em saúde, pesquisa sobre malária, fortalecimento de capacidade na África, educação em aprendizado de máquina