Vous êtes ici : Accueil > Actualités > Changement de paradigme dans l’ingénierie moléculaire

Idées et débats | Santé & sciences du vivant | Chimie | Intelligence artificielle

Changement de paradigme dans l’ingénierie moléculaire


​Le dernier prix Nobel scientifique de l'édition 2024, celui de chimie, récompense la conception et la prédiction de protéines par intelligence artificielle. Le point avec Raphaël Guérois, Jessica Andreani et Hugues Nury, des instituts Joliot et Irig de la DRF, dont les recherches s'inscrivent dans la continuité de celles des lauréats, David Baker, Demis Hassabis et John Jumper.​

Publié le 18 octobre 2024

​Le corps humain compte environ 20 000 types de protéines différentes, assurant diverses fonctions dans l'organisme. Ces longues molécules sont constituées d'un enchaînement d'acides aminés qui s'emboîtent parfaitement les uns aux autres, sous la forme d'une architecture 3D complexe lorsque la protéine est repliée. Au-delà de l'humain, en échantillonnant les vingt acides aminés disponibles, la nature a sélectionné des millions de protéines fonctionnelles au cours de l'évolution. Or, il y a plusieurs milliards de combinaisons possibles d'acides aminés et potentiellement autant de protéines « aléatoires » à créer. Identifier parmi elles les protéines artificielles aux fonctions désirées est le défi qui anime depuis toujours la communauté des biochimistes. Un défi qu'a relevé avec succès David Baker, co-lauréat du prix Nobel de chimie 2024 !

De la conception de protéines à visée thérapeutique …

En testant différentes approches dès 1995, le spécialiste américain de biologie computationnelle a mis au point en 2003 la première protéine artificielle, Top7, montrant qu'il était possible de créer un échafaudage 3D stable extrêmement complexe. Il a depuis développé des outils informatiques de rupture, dont le programme RosettaFold Diffusion en 2023.

Longtemps, la communauté a tenté de décrire et de quantifier les forces physiques à l'œuvre pour assurer la stabilité des protéines. Mais ce travail de conception moléculaire a vraiment porté ses fruits lorsque les chercheurs ont combiné ces stratégies aux approches d'intelligence artificielle, exploitant les données structurales acquises depuis une quarantaine d'années par les équipes de biologie structurale partout dans le monde, dont celles des instituts Irig et Joliot de la DRF.

Il s'est alors agi d'apprendre aux algorithmes à construire des protéines en « habillant » les échafaudages 3D avec la bonne combinaison d'acides aminés. C'est ainsi qu'a pu être conçu un vaccin contre le Covid-19, aujourd'hui commercialisé en Corée du Sud et en Angleterre. Une nouvelle approche également poursuivie au CEA-Irig pour concevoir de nouveaux insecticides plus sélectifs et à durée de vie moins longue dans l'environnement.

… à la prédiction de leur structure par intelligence artificielle

Les seconds lauréats de ce prix Nobel de chimie, Demis Hassabis et John Jumper, ont bien compris la puissance de l'intelligence artificielle, qu'ils ont exploitée pour prédire le repliement 3D des protéines à partir de leur séquence en acides aminés. En 2020, l'équipe de DeepMind (filiale de Google) a développé Alphafold2, un outil révolutionnaire utilisant les réseaux de neurones dits « transformers » pour analyser l'immense base de données open source de séquences et de structures de protéines.

Alphafold2 parvient ainsi à prédire avec précision les structures protéiques, y compris leurs interactions, en interprétant les corrélations complexes existant entre la séquence des acides aminés et la structure 3D ; de telles combinaisons restant inaccessibles à la compréhension humaine.

Malgré ses avancées, cette intelligence artificielle présente toutefois des limites. Par exemple, elle prend moins bien en compte les régions protéiques « désordonnées » qui sont pourtant cruciales dans l'émergence de certains cancers, comme en témoigne une récente étude de nos collègues du CEA-Joliot. Par ailleurs, Alphafold2 ne donne qu'une image statique des protéines, alors que les mouvements dynamiques sont essentiels à leur fonction.

Ces limitations pourraient n'être que temporaires étant donnée la vitesse des transformations du domaine, tel que l'illustre la version 2024 Alphafold3. Les processus permettant de passer des séquences aux structures et des structures aux séquences ayant été encodés, il est probable que les défis restants seront surmontés, permettant de convoquer un nouveau dialogue entre la biologie et la physique. Ces nouveaux outils incitent profondément notre communauté à s'adapter, à en maîtriser l'utilisation et à passer du tournevis à la visseuse électrique dans le domaine de l'ingénierie moléculaire !


Par Raphaël Guérois et Jessica Andreani, bio-informaticiens au CEA-Joliot, et Hugues Nury, spécialiste de biologie structurale au CEA-Irig

.




Haut de page