Clear Sky Science · pt
MAMMAL - Arquitetura Multimodal Alinhada Molecular e Linguagem para descoberta biomédica
Por que uma descoberta de fármacos mais inteligente importa
Encontrar novos medicamentos é um processo lento, arriscado e extremamente caro. A maioria dos candidatos a fármacos ainda falha em ensaios clínicos, muitas vezes depois de anos de trabalho. Ao mesmo tempo, laboratórios de biologia agora produzem grandes volumes de dados sobre genes, proteínas, células e compostos químicos. Este artigo apresenta o MAMMAL, um novo tipo de sistema de inteligência artificial que aprende com todos esses tipos de dados simultaneamente. Ao conectar padrões entre moléculas, células e drogas, ele pretende ajudar cientistas a escolher melhores alvos, projetar medicamentos mais eficazes e evitar becos sem saída caros mais cedo no processo.

Um cérebro para muitos tipos de dados biológicos
As ferramentas de IA atuais em biomedicina costumam ser especializadas: um modelo lida com sequências de proteínas, outro com pequenas moléculas, e outro observa apenas a atividade gênica. O MAMMAL segue outro caminho. Ele trata proteínas, anticorpos, fármacos de pequena molécula e perfis de expressão gênica como diferentes tipos de “sentenças” que podem ser lidas pelo mesmo modelo. Para isso, os pesquisadores construíram uma maneira flexível de transformar cada tipo de dado em um formato de sequência compartilhado, e treinaram uma grande rede baseada em transformadores—similar em espírito aos modelos de linguagem modernos—em cerca de dois bilhões de exemplos extraídos de conjuntos de dados públicos de proteínas, anticorpos, químicos e dados em nível de célula.
Aprendendo a linguagem de drogas e células
O MAMMAL foi projetado tanto para entender quanto para gerar informação biológica. Ele pode classificar, ranquear ou prever valores numéricos como força de ligação ou potência de um fármaco, e também pode inventar novas sequências, por exemplo sugerindo novos fragmentos de anticorpos. Uma característica-chave é que ele não vê apenas símbolos; também pode receber e produzir valores numéricos diretamente, como medições de ensaios de laboratório. Isso o ajuda a raciocinar sobre quão fortemente uma droga se liga a uma proteína ou como uma célula cancerígena responde a um tratamento. Todas essas tarefas são enquadradas como variações de uma atividade central: transformar uma sequência em outra, muito parecido com traduzir entre idiomas.

Testando o modelo ao longo da cadeia de descoberta de fármacos
Para verificar se essa abordagem unificada realmente ajuda, os autores testaram versões afinadas do MAMMAL em onze diferentes benchmarks que imitam etapas reais da descoberta de fármacos. Isso incluiu reconhecer tipos celulares a partir de dados de expressão gênica de célula única, prever se pequenas moléculas conseguem atravessar a barreira hematoencefálica ou causar efeitos tóxicos, estimar como células cancerígenas respondem a vários fármacos e prever quão fortemente proteínas se ligarão entre si ou a pequenas moléculas. O MAMMAL alcançou ou superou o melhor desempenho relatado em nove de onze testes, frequentemente superando modelos altamente especializados ajustados para apenas um tipo de dado.
Projetando anticorpos e superando modelos de estrutura no próprio campo deles
Alguns dos resultados mais notáveis vieram de tarefas baseadas em proteínas. Em um desafio de “preenchimento” de anticorpo—onde o objetivo é completar os segmentos mais variáveis que de fato fazem contato com um alvo—o MAMMAL recuperou os aminoácidos corretos com muito mais frequência do que métodos anteriores, especialmente na região central notoriamente difícil do sítio de ligação do anticorpo. A equipe também investigou se o MAMMAL poderia distinguir anticorpos ligantes de não ligantes e o comparou ao AlphaFold 3, uma ferramenta de predição estrutural cujos escores de confiança podem ser usados como uma inferência indireta sobre ligação. Em cinco de sete alvos de teste, incluindo proteínas grandes e flexíveis relevantes para câncer, as predições de ligação do MAMMAL foram claramente mais precisas, mesmo tendo visto apenas sequências e não estruturas 3D.
Sinais de impacto no mundo real
Além dos benchmarks, os pesquisadores verificaram se as predições do modelo correspondem à realidade laboratorial. Eles examinaram quatro medicamentos contra câncer, incluindo Carfilzomibe, aprovado principalmente para cânceres hematológicos. O MAMMAL previu corretamente a força relativa desses fármacos em centenas de linhas celulares, e essa classificação foi confirmada em experimentos focados. A descoberta sugere que o fármaco pode ter um uso mais amplo em tumores sólidos do que se reconhece atualmente, uma possibilidade que agora justifica testes adicionais. O modelo também mostrou potencial em colaborações que buscam prever a atividade de anticorpos contra vírus da gripe e outros alvos.
O que isso significa para os futuros medicamentos
Em termos simples, o MAMMAL atua como um leitor e escritor multilíngue para a biologia, capaz de conectar o que acontece no nível de genes, proteínas e compostos químicos dentro de uma única estrutura. Seu desempenho robusto em várias tarefas sugere que modelos unificados assim podem se tornar componentes centrais de “células virtuais” assistidas por IA que ajudam cientistas a explorar tratamentos in silico antes de entrar no laboratório. Embora não substitua experimentos—e ainda exija validação cuidadosa—pode reduzir o espaço de busca, destacar possibilidades inesperadas e tornar o longo caminho da ideia ao fármaco aprovado um pouco mais rápido e eficiente.
Citação: Shoshan, Y., Raboh, M., Ozery-Flato, M. et al. MAMMAL - Molecular Aligned Multi-Modal Architecture and Language for biomedical discovery. npj Drug Discov. 3, 14 (2026). https://doi.org/10.1038/s44386-026-00047-4
Palavras-chave: descoberta de fármacos orientada por IA, modelos biomédicos multimodais, desenho de anticorpos, interações proteína–droga, perfil de expressão gênica