Clear Sky Science · pt

CODE além do FAIR: um roteiro para software de pesquisa reutilizável

· Voltar ao índice

Por que o código invisível por trás da ciência importa

Por trás de quase toda descoberta científica moderna, desde mapear galáxias até decodificar o DNA, há software realizando discretamente o trabalho pesado. Ainda assim, esse código frequentemente é tratado como um detalhe: oculto, frágil e difícil de reutilizar ou verificar por terceiros. Este texto defende que, se queremos ciência confiável e reprodutível, devemos tratar o software de pesquisa como um produto científico central, e não como uma ferramenta descartável. Os autores propõem um roteiro prático, chamado CODE, para ajudar pesquisadores e instituições a transformar os scripts pontuais de hoje em blocos confiáveis e compartilháveis para as descobertas de amanhã.

Figure 1
Figure 1.

Como a ciência passou a depender de software

Em poucas décadas, o software se tornou central em praticamente todas as áreas de pesquisa. Estudos mostram que perto da metade dos artigos científicos atualmente mencionam software, seja para analisar dados, controlar instrumentos, simular sistemas complexos ou até como principal produto de pesquisa. Ao contrário de um artigo finalizado ou de um conjunto de dados estático, porém, o software é um objeto “vivo”: ele muda à medida que bugs são corrigidos, funcionalidades são adicionadas e novas pessoas contribuem. Múltiplas versões do mesmo programa coexistem, e cada uma depende de um delicado ambiente circundante de sistemas operacionais e bibliotecas. Uma pequena alteração nesse ambiente pode alterar resultados — ou quebrar o código por completo. Essa natureza viva e interdependente faz com que princípios tradicionais de compartilhamento de dados, projetados para arquivos estáticos, não sejam suficientes para tornar o software verdadeiramente reutilizável.

Do FAIR ao CODE: uma nova forma de pensar sobre ferramentas de pesquisa

Na última década, os princípios FAIR — Encontrável (Findable), Acessível (Accessible), Interoperável (Interoperable), Reutilizável (Reusable) — transformaram a forma como os cientistas lidam com dados. Tentativas de estender o FAIR ao software avançaram de forma importante, mas os autores argumentam que o software precisa de orientações mais ajustadas. Com base em décadas de experiência das comunidades de software livre e de código aberto, eles propõem um roteiro gradual organizado em quatro pilares que formam convenientemente o acrônimo CODE: Abrir (Open), Documentar (Document), Executar (Execute), Colaborar (Collaborate). Em vez de exigir práticas perfeitas desde o início, o roteiro é por níveis, de modo que pesquisadores com pouca formação formal em engenharia de software possam adotar melhores hábitos passo a passo, enquanto equipes mais avançadas possam mirar níveis maiores de robustez e abertura.

Tornar o código aberto, compreensível e executável

No pilar “Abrir”, os autores incentivam os cientistas a deixar de enviar arquivos zip por e‑mail mediante solicitação e, em vez disso, publicar seu código‑fonte em plataformas públicas de desenvolvimento que acompanham o histórico e suportam colaboração. Eles destacam a importância do arquivamento de longo prazo em infraestruturas dedicadas, como arquivos globais de código‑fonte, para que projetos permaneçam disponíveis mesmo se um site de hospedagem encerrar. Licenças claras de código aberto e autoria explícita são essenciais para que outros saibam o que é permitido legalmente e a quem creditar. O pilar “Documentar” foca em tornar o software compreensível: usar nomes significativos, adicionar comentários que expliquem o raciocínio em vez de repetir o código, fornecer exemplos simples e tutoriais, e escrever documentação de referência separada para as partes do programa com as quais os usuários realmente interagem.

Garantir que resultados possam ser reproduzidos e compartilhados

O pilar “Executar” enfrenta uma frustração comum: código que existe tecnicamente, mas não pode ser executado em outro lugar. O roteiro encoraja os autores a listar o hardware e software dos quais seu programa depende, oferecer ambientes computacionais reutilizáveis quando possível (por meio de contêineres ou gerenciadores de pacotes especializados), disponibilizar suítes de testes para que usuários possam verificar se o software se comporta corretamente em suas máquinas, e compartilhar casos de uso reais e executáveis que espelhem análises típicas. O pilar final, “Colaborar”, incentiva engajamento aberto e contínuo: responder a relatórios de bugs e pedidos de funcionalidades, explicar se e como contribuições externas são bem‑vindas, ser transparente quanto aos limites do suporte e, quando apropriado, construir uma comunidade por meio de tutoriais, workshops e mentoria. Juntos, esses passos transformam código de pesquisa isolado em uma ferramenta compartilhada em que muitos podem confiar e aprimorar.

O papel de todos no apoio a um melhor software de pesquisa

O artigo deixa claro que pesquisadores individuais não podem resolver o problema do software sozinhos. Instituições devem investir em engenheiros de software de pesquisa dedicados, reconhecer software em contratações e promoções, e fornecer plataformas de hospedagem de código bem gerenciadas. Financiadores são incentivados a apoiar a manutenção de longo prazo de ferramentas amplamente usadas, não apenas a criação de novas, e a promover licenciamento de código aberto como padrão para ajudar a enfrentar a crise de reprodutibilidade. Bibliotecas podem ampliar seu papel tradicional ajudando a arquivar software, gerenciar identificadores e curar catálogos que tornem programas importantes fáceis de encontrar. Por fim, editores são chamados a exigir que o código por trás dos resultados publicados seja de fato compartilhado, vinculado ao artigo e, cada vez mais, sujeito a revisão, assim como o próprio artigo.

Figure 2
Figure 2.

O que este roteiro significa para o futuro da ciência

De forma direta, a conclusão dos autores é que boa ciência hoje depende de bom software, e bom software não ocorre por acaso. O roteiro CODE oferece um caminho realista do mosaico atual de scripts ocultos para um ecossistema onde o código de pesquisa é aberto, bem explicado, executável em outros ambientes e aprimorado por muitas mãos. Seguindo esses passos — e com universidades, financiadores, bibliotecas e revistas cumprindo seus papéis — a ciência pode avançar rumo a um mundo em que resultados não sejam apenas impressionantes ao serem anunciados, mas também verificáveis, reutilizáveis e duráveis por anos.

Citação: Di Cosmo, R., Granger, S., Hinsen, K. et al. CODE beyond FAIR: a roadmap for reusable research software. Sci Data 13, 514 (2026). https://doi.org/10.1038/s41597-026-06705-6

Palavras-chave: software de pesquisa, código aberto, reprodutibilidade, sustentabilidade de software, ciência aberta