Clear Sky Science · pt

Otimização da transferência entre domínios para potenciais interatômicos universais de aprendizado de máquina

2026-03-03 · Voltar ao índice

Simulações mais inteligentes para materiais reais

Projetar novas baterias, catalisadores e materiais eletrônicos depende cada vez mais de simulações por computador que acompanham átomos em movimento. As simulações mais confiáveis, baseadas em mecânica quântica, são extremamente precisas, mas muito lentas para explorar milhões de candidatos. Modelos de aprendizado de máquina mais rápidos podem imitar cálculos quânticos, porém frequentemente funcionam apenas em situações restritas — por exemplo, apenas cristais ou apenas moléculas. Este artigo propõe uma maneira de construir um modelo universal, chamado SevenNet‑Omni, que permanece preciso em muitos tipos de materiais, de superfícies metálicas e líquidos moleculares a estruturas porosas, mantendo velocidade suficiente para descoberta em larga escala.

Por que os modelos atômicos atuais não se adaptam bem

Potenciais interatômicos por aprendizado de máquina atuais costumam ser treinados em um único banco de dados cuidadosamente curado: um para cristais inorgânicos, outro para moléculas com perfil farmacêutico, outro ainda para superfícies catalíticas. Cada banco é construído com configurações de química quântica próprias, de modo que as paisagens energéticas subjacentes diferem de maneiras sutis e não lineares. Simplesmente unir esses dados — talvez deslocando ou escalando energias — adiciona ruído e leva a modelos que se ajustam bem ao domínio de origem, mas falham ao descrever químicas desconhecidas ou métodos quânticos ligeiramente diferentes. À medida que problemas de materiais misturam domínios, como moléculas reagindo em superfícies sólidas em solução, essa falta de transferibilidade tornou‑se um gargalo sério.

Uma espinha dorsal compartilhada com especialização suave

Os autores abordam isso tratando cada banco de dados como uma “tarefa” em uma única rede neural multi‑tarefa. No interior do modelo, um conjunto de parâmetros forma uma espinha dorsal compartilhada, capturando regras gerais da ligação atômica, enquanto parâmetros menores e específicos por tarefa ajustam o comportamento para conjuntos de dados particulares. Uma análise matemática mostra que, se as partes específicas por tarefa crescem demais, o modelo passa a memorizar cada banco de dados e esquece como generalizar. Para evitar isso, os autores aplicam regularização seletiva: penalizam diretamente parâmetros específicos por tarefa grandes, mas permitem que a espinha dorsal compartilhada cresça conforme necessário. Isso incentiva a rede a explicar o máximo possível por meio de física comum, usando apenas correções modestas para cada domínio.

Ponteando mundos distantes com alguns exemplos-chave

Mesmo com regularização, algumas regiões do espaço químico aparecem apenas em um banco de dados, então a espinha dorsal compartilhada não recebe orientação ali. Para corrigir isso, a equipe introduz um “conjunto de ponte entre domínios”. Eles selecionam cuidadosamente uma fração minúscula — cerca de uma em mil — de configurações de vários bancos e as recalculam usando um mesmo conjunto de parâmetros quânticos. Essas estruturas de ponte funcionam como frases bilíngues em um livro de idiomas: conectam diretamente como dois métodos quânticos diferentes descrevem a mesma cena atômica. Quando incluídas no treinamento, apertam fortemente o elo entre tarefas, alinhando as paisagens energéticas sem a necessidade de recalcular tudo por força bruta. Testes sistemáticos mostram que regularização e o conjunto de ponte se reforçam mutuamente, melhorando o desempenho além do que cada um conseguiria isoladamente.

Construindo e testando um motor atômico universal

Com base nessas ideias, os autores treinam o SevenNet‑Omni em 15 conjuntos de dados públicos compreendendo cerca de 242 milhões de estruturas atômicas, cobrindo moléculas, cristais, catalisadores, estruturas metal‑orgânicas e múltiplos níveis de teoria quântica. Em seguida, eles comparam o modelo em situações familiares e desafiadoras: estabilidade de cristais, contornos de grão em metais, defeitos em aços, barreiras de torção em moléculas tipo fármaco, perovskitas híbridas orgânico‑inorgânicas, adsorção em estruturas porosas relevantes para captura de carbono e reações em superfícies metálicas importantes para conversão de hidrogênio e dióxido de carbono. Nesses testes, o SevenNet‑Omni frequentemente iguala ou supera modelos especializados treinados para um único domínio, e mantém “precisão química” para muitas energias de reação e adsorção. Também reproduz com precisão resultados de um método quântico caro (r²SCAN) ao aprender como esse método se relaciona com dados mais baratos e abundantes.

O que isso significa para a descoberta de novos materiais

Para não especialistas, a mensagem principal é que o SevenNet‑Omni se comporta como um cientista experiente que trabalhou em muitos subcampos. Em vez de se ajustar demais a um problema estreito, ele aprende princípios químicos amplos e os aplica de forma flexível a situações novas, desde captura de gases em sólidos porosos até reações em eletrodos metálicos. O artigo demonstra que isso é viável ao compartilhar cuidadosamente informação entre conjuntos de dados, enquanto se contêm levemente suas diferenças, e ao adicionar um pequeno número de exemplos de “tradução” entre métodos quânticos. À medida que bancos de dados maiores e mais diversos surgem, essa estratégia de treinamento oferece um caminho escalável rumo a modelos atômicos verdadeiramente universais e confiáveis que podem acelerar descobertas na química, física e ciência dos materiais.

Citação: Kim, J., You, J., Park, Y. et al. Optimizing cross-domain transfer for universal machine learning interatomic potentials. Nat Commun 17, 3432 (2026). https://doi.org/10.1038/s41467-026-70195-8

Palavras-chave: potenciais interatômicos por aprendizado de máquina, modelagem de materiais multi-domínio, transferência de aprendizado, potencial atomístico universal, descoberta de materiais