Logo Zéphyrnet

Cette IA peut concevoir les machines de la vie avec une précision atomique

Date :

Les protéines sont des créatures sociales. Ce sont aussi des caméléons. En fonction des besoins d'une cellule, leur structure se transforme rapidement et s'accroche à d'autres biomolécules dans une danse complexe.

Ce n'est pas un dîner-théâtre moléculaire. Ces partenariats sont plutôt au cœur des processus biologiques. Certains activent ou désactivent les gènes. D’autres poussent les cellules « zombies » vieillissantes à s’autodétruire ou à maintenir nos cognitions et notre mémoire en parfait état en remodelant les réseaux cérébraux.

Ces connexions ont déjà inspiré un large éventail de thérapies, et de nouvelles thérapies pourraient être accélérées par l’IA capable de modéliser et de concevoir des biomolécules. Mais les outils d’IA précédents se concentraient uniquement sur les protéines et leurs interactions, laissant de côté leurs partenaires non protéiques.

Cette semaine, selon une étude in Sciences a élargi la capacité de l'IA à modéliser une grande variété d'autres biomolécules qui s'accrochent physiquement aux protéines, y compris les petites molécules contenant du fer qui forment le centre des transporteurs d'oxygène.

Dirigée par le Dr David Baker de l’Université de Washington, la nouvelle IA élargit la portée de la conception biomoléculaire. Baptisé RoseTTAFold All-Atom, il s'appuie sur un précédent système uniquement protéique pour incorporer une myriade d'autres biomolécules, telles que l'ADN et l'ARN. Il ajoute également de petites molécules, par exemple du fer, qui font partie intégrante de certaines fonctions protéiques.

L’IA n’a appris que de la séquence et de la structure des composants – sans aucune idée de leur structure 3D – mais peut cartographier des machines moléculaires complexes au niveau atomique.

Dans l’étude, lorsqu’elle est associée à l’IA générative, RoseTTAFold All-Atom a créé des protéines qui s’accrochent facilement à un médicament contre les maladies cardiaques. L’algorithme a également généré des protéines qui régulent l’hème, une molécule riche en fer qui aide le sang à transporter l’oxygène, et la biline, un produit chimique présent dans les plantes et les bactéries qui absorbe la lumière pour leur métabolisme.

Ces exemples ne sont que des preuves de concept. L’équipe rend RoseTTAFold All-Atom au public pour que les scientifiques puissent créer de multiples biocomposants en interaction avec une complexité bien plus grande que les complexes protéiques seuls. À leur tour, ces créations pourraient conduire à de nouvelles thérapies.

"Notre objectif ici était de créer un outil d'IA capable de générer des thérapies plus sophistiquées et d'autres molécules utiles", a déclaré l'auteur de l'étude Woody Ahern dans un communiqué de presse.

Dream On

En 2020, AlphaFold de Google DeepMind et RoseTTAFold de Baker Lab ont résolu le problème de prédiction de la structure des protéines qui déroutait les scientifiques pendant un demi-siècle et ont inauguré une nouvelle ère de recherche sur les protéines. Des versions mises à jour de ces algorithmes ont cartographié toutes les structures protéiques connues et inconnues de la science.

Ensuite, l’IA générative – la technologie derrière ChatGPT d’OpenAI et Gemini de Google – a déclenché une frénésie créative de protéines de conception dotées d’une gamme d’activités impressionnante. Certaines protéines nouvellement générées régulaient une hormone qui contrôlait les niveaux de calcium. D'autres ont conduit à des enzymes ou des protéines artificielles qui pourraient changer facilement de forme comme les transistors dans les circuits électroniques.

En hallucinant un nouveau monde de structures protéiques, l’IA générative a le potentiel d’imaginer une génération de protéines synthétiques pour réguler notre biologie et notre santé.

Mais il y a un problème. Les modèles d’IA protéiques de concepteur ont une vision tunnel : ils sont trop axé sur les protéines.

Lorsque l’on imagine les composants moléculaires de la vie, les protéines, l’ADN et les acides gras viennent à l’esprit. Mais à l’intérieur d’une cellule, ces structures sont souvent maintenues ensemble par de petites molécules qui s’entremêlent avec les composants environnants, formant ensemble un bio-assemblage fonctionnel.

Un exemple est l’hème, une molécule en forme d’anneau qui contient du fer. L'hème est la base de l'hémoglobine dans les globules rouges, qui transporte l'oxygène dans tout le corps et s'accroche aux « crochets » protéiques environnants à l'aide de diverses liaisons chimiques.

Contrairement aux protéines ou à l’ADN, qui peuvent être modélisés comme une chaîne de « lettres » moléculaires, les petites molécules et leurs interactions sont difficiles à capturer. Mais ils sont essentiels aux machines moléculaires complexes de la biologie et peuvent modifier considérablement leurs fonctions.

C'est pourquoi, dans leur nouvelle étude, les chercheurs ont cherché à élargir la portée de l'IA au-delà des protéines.

"Nous avons décidé de développer une méthode de prédiction de structure capable de générer des coordonnées 3D pour tous les atomes" d'une molécule biologique, y compris les protéines, l'ADN et d'autres modifications, écrivent les auteurs dans leur article.

Équipe de balises

L’équipe a commencé par modifier une précédente IA de modélisation protéique pour incorporer d’autres molécules.

L'IA fonctionne à trois niveaux : le premier analyse la séquence de « lettres » unidimensionnelle d'une protéine, comme les mots sur une page. Ensuite, une carte 2D indique la distance entre chaque « mot » de protéine les uns des autres. Enfin, les coordonnées 3D, un peu comme le GPS, cartographient la structure globale de la protéine.

Vient ensuite la mise à niveau. Pour incorporer des informations sur les petites molécules dans le modèle, l'équipe a ajouté des données sur les sites atomiques et les connexions chimiques dans les deux premières couches.

Dans le troisième, ils se sont concentrés sur la chiralité, c'est-à-dire si la structure d'un produit chimique est gauche ou droite. Comme nos mains, les produits chimiques peuvent aussi avoir des structures en miroir avec des conséquences biologiques très différentes. Comme pour enfiler des gants, seule la « doigté » correcte d’un produit chimique peut s’adapter à un « gant » de bio-assemblage donné.

RoseTTAFold All-Atom a ensuite été formé sur plusieurs ensembles de données contenant des centaines de milliers de points de données décrivant les protéines, les petites molécules et leurs interactions. Finalement, il a appris les propriétés générales des petites molécules utiles pour construire des assemblages protéiques plausibles. Pour vérifier la cohérence, l’équipe a également ajouté une « jauge de confiance » pour identifier les prédictions de haute qualité, celles qui conduisent à des bio-assemblages stables et fonctionnels.

Contrairement aux précédents modèles d’IA composés uniquement de protéines, RoseTTAFold All-Atom « peut modéliser des systèmes biomoléculaires complets », a écrit l’équipe.

Dans une série de tests, le modèle amélioré a surpassé les méthodes précédentes en apprenant à « ancrer » de petites molécules sur une protéine donnée – un élément clé de la découverte de médicaments – en prédisant rapidement les interactions entre les protéines et les molécules non protéiques.

Brave New World

L’incorporation de petites molécules ouvre un tout nouveau niveau de conception de protéines personnalisées.

En guise de preuve de concept, l'équipe a associé RoseTTAFold All-Atom à un modèle d'IA générative dont elle disposait. développé précédemment et conçu des partenaires protéiques pour trois petites molécules différentes.

Le premier était la digoxigénine, utilisée pour traiter les maladies cardiaques mais qui peut avoir des effets secondaires. Une protéine qui s'y accroche réduit la toxicité. Même sans connaissance préalable de la molécule, l’IA a conçu plusieurs liants protéiques qui ont tempéré les niveaux de digoxigénine lorsqu’ils ont été testés sur des cellules en culture.

L’IA a également conçu des protéines qui se lient à l’hème, une petite molécule essentielle au transfert d’oxygène dans les globules rouges, et à la biline, qui aide diverses créatures à absorber la lumière.

Contrairement aux méthodes précédentes, a expliqué l’équipe, l’IA peut « facilement générer de nouvelles protéines » qui s’accrochent à de petites molécules sans aucune connaissance experte.

Il peut également faire des prédictions très précises sur la force des connexions entre les protéines et les petites molécules au niveau atomique, permettant ainsi de construire rationnellement un tout nouvel univers de structures biomoléculaires complexes.

« En permettant aux scientifiques du monde entier de générer des biomolécules avec une précision sans précédent, nous ouvrons la porte à des découvertes révolutionnaires et à des applications pratiques qui façonneront l'avenir de la médecine, de la science des matériaux et au-delà », a déclaré Baker.

Crédit image : Ian C. Haydon

spot_img

Dernières informations

spot_img