Clear Sky Science · fr
Atlas des structures prédites de complexes protéiques à travers les règnes
Pourquoi cartographier les partenariats protéiques est important
Chaque cellule de votre corps est remplie de petites machines moléculaires constituées de protéines. Ces protéines agissent rarement seules ; elles s’associent par paires ou en groupes pour remplir presque toutes les fonctions de la vie. Pourtant, bien que les scientifiques connaissent des millions de partenariats protéiques potentiels, ils ne disposaient de plans tridimensionnels détaillés que pour une faible fraction d’entre eux. Cette étude utilise l’intelligence artificielle pour prédire comment plus d’un million de paires protéiques s’emboîtent, chez les bactéries, les archées, les plantes, les animaux et les virus, créant un atlas susceptible d’orienter la biologie et la médecine futures.
Construire une carte géante des paires protéiques
Les chercheurs se sont donné pour objectif de prédire les formes des complexes protéiques à une échelle inédite. Ils ont utilisé des outils basés sur AlphaFold, capables d’inférer la structure des protéines à partir de leur séquence d’acides aminés, et les ont appliqués à des partenaires protéiques candidats issus de larges bases de données publiques d’interactions et de données génomiques. Au total, ils ont modélisé environ 1,1 million de paires protéiques possibles, puis appliqué des contrôles qualité stricts pour déterminer quelles prédictions étaient fiables. Ces contrôles portaient sur l’ajustement des surfaces protéiques et sur la solidité de l’interface entre protéines, évalués par plusieurs méthodes de notation indépendantes.
Après filtrage, l’équipe a obtenu 181 671 complexes de haute confiance. Parmi eux figuraient plus de 100 000 complexes provenant de bactéries et d’archées, plus de 37 000 issus de protéines humaines et près de 20 000 de protéines de souris et de plantes. Cette riche collection de formes prédites leur a permis de regrouper des complexes similaires, révélant des schémas de partenariat récurrents qui réapparaissent à travers des branches éloignées de l’arbre de la vie. Ces formes répétées suggèrent des solutions anciennes que l’évolution a réutilisées dans de nombreux organismes.

Découvrir des machines cachées chez les microbes
L’atlas est particulièrement puissant pour les microbes. Chez les bactéries et les archées, les gènes qui travaillent ensemble sont souvent adjacents sur le chromosome. En combinant cette règle génomique simple avec leurs prédictions de structure, les auteurs ont identifié plus de 100 000 partenariats physiques probables, y compris de nombreux cas dans des bactéries pathogènes. En retraçant les réseaux de ces interactions, ils ont pu reconstruire de grands assemblages moléculaires, tels que des parties des usines protéiques connues sous le nom de ribosomes, et des coques complexes qui aident les bactéries à métaboliser des nutriments inhabituels. Ils ont également montré comment de petites unités répétées peuvent s’empiler pour former des machines multicouches sophistiquées, fournissant des hypothèses sur la construction des systèmes de virulence bactériens.
Relier les protéines humaines et les ruses virales
L’équipe s’est aussi intéressée à la manière dont les virus se connectent aux protéines humaines. En utilisant des bases de données triées sur le volet de contacts prédits entre virus et humain, ils ont modélisé plus de 80 000 interactions candidates et en ont trouvé plus de 5 000 qui satisfaisaient leurs seuils de confiance. Certaines protéines humaines sont apparues comme des hubs, contactées par de nombreux virus différents, y compris des membres de la famille 14-3-3 qui aident à contrôler la signalisation cellulaire. Les modèles suggéraient que certaines protéines virales pourraient saisir la même surface d’une protéine humaine qu’un partenaire humain utilise normalement, s’intercalant ainsi et perturbant les processus cellulaires habituels. Des expériences en laboratoire ont confirmé plusieurs contacts prédits, y compris des protéines virales qui se lient à des points d’entrée connus ou potentiels des cellules humaines.

Suivre l’histoire des protéines à travers la forme
Au-delà du catalogue des complexes actuels, les auteurs ont utilisé l’atlas pour explorer l’histoire des protéines. En comparant chaque partenaire de leurs complexes à des millions de structures de protéines uniques dans la base de données AlphaFold, ils ont trouvé de nombreux cas où deux protéines modernes qui interagissent ressemblent à différentes sections d’une seule protéine plus longue dans une autre espèce. Ces schémas indiquent des événements passés de fusion de gènes, où des gènes se sont joints, ou de fission, où un gène continu s’est scindé en parties. L’étude a aussi mis au jour des exemples où des protéines virales ou microbiennes imitaient étroitement des complexes humains, suggérant des pressions évolutives de long terme pour préserver certaines formes.
De l’atlas aux outils pratiques
Pour montrer que leur atlas est plus qu’un référentiel statique, les scientifiques l’ont utilisé pour améliorer un modèle d’apprentissage profond qui prédit quels endroits à la surface d’une protéine formeront des contacts avec des partenaires. L’entraînement sur des complexes prédits de haute qualité a affiné la capacité du modèle à identifier des sites de liaison sur des structures réellement résolues expérimentalement. Cela suggère que de grandes collections de prédictions précises peuvent alimenter de nouvelles méthodes, même lorsque les données expérimentales sont limitées, et peuvent aider les travaux en découverte de médicaments, ingénierie des protéines et conception de vaccins.
Ce que cela signifie pour l’avenir
Pour un non-spécialiste, l’idée principale est que nous disposons désormais d’un premier brouillon montrant comment un nombre immense de paires protéiques pourrait s’emboîter à travers de nombreuses formes de vie. Bien que non parfait, cet atlas étend considérablement l’information structurale disponible pour les chercheurs. Il offre des points de départ pour comprendre comment les infections s’établissent, comment les machines cellulaires se construisent et comment les familles de protéines ont évolué. À mesure que des tests expérimentaux affineront ces prédictions et que des atlases similaires s’élargiront pour inclure d’autres types de molécules, ce type de carte deviendra un guide essentiel pour explorer et, éventuellement, redesigner la machinerie moléculaire du vivant.
Citation: Qi, X., Ye, C., Liang, J. et al. Atlas of predicted protein complex structures across kingdoms. Nat Commun 17, 4397 (2026). https://doi.org/10.1038/s41467-026-70884-4
Mots-clés: complexes protéiques, AlphaFold, interactions protéiques, interactions virus–humain, biologie structurale