Logo Zéphyrnet

Récapitulatif des promesses et des pièges – Première partie » Blog CCC

Date :

Le CCC a soutenu trois sessions scientifiques lors de la conférence annuelle de l'AAAS de cette année, et au cas où vous ne pourriez pas y assister en personne, nous récapitulerons chaque session. Cette semaine, nous résumerons les moments forts de la séance, »L'IA générative en science : promesses et pièges.» Dans la première partie, nous résumerons l'introduction et la présentation du Dr Rebecca Willett.

Le premier panel de l'AAAS de la réunion annuelle 2024 de CCC a eu lieu le vendredi 16 février, deuxième jour de la conférence. Le panel, modéré par les membres du CCC Dr Matthieu Turk, président du Toyota Technological Institute de Chicago, était composé d'experts qui appliquent l'intelligence artificielle à divers domaines scientifiques. Dr Rebecca Willett, professeur de statistiques et d'informatique à l'Université de Chicago, a axé sa présentation sur la manière dont les modèles génératifs peuvent être utilisés dans les sciences et sur les raisons pour lesquelles les modèles disponibles dans le commerce ne suffisent pas pour être appliqués à la recherche scientifique. Dr Markus Buehler, professeur d'ingénierie au Massachusetts Institute of Technology, a parlé des modèles génératifs appliqués à la science des matériaux, et Dr Duncan Watson-Parris, professeur adjoint à la Scripps Institution of Oceanography et au Halıcıoğlu Data Science Institute de l'UC San Diego, a discuté de la manière dont les modèles génératifs peuvent être utilisés dans l'étude des sciences du climat.

Le Dr Turk, expert en vision par ordinateur et en interaction homme-machine, a commencé le panel en distinguant l’IA générative de toutes les IA. « Au cœur des applications d'IA générative se trouvent des modèles génératifs composés de réseaux neuronaux profonds qui apprennent la structure de leurs volumineuses données d'entraînement, puis génèrent de nouvelles données basées sur ce qu'ils ont appris. »

Le Dr Turk a également souligné les préoccupations courantes concernant les systèmes génératifs, à la fois dus aux défaillances des systèmes eux-mêmes, tels que ceux qui citent des mémoires juridiques inexistants, et également dus à leur utilisation par de mauvais acteurs pour générer de faux contenus, tels que de faux fichiers audio ou audio. vidéo de politiciens ou de célébrités.

« Plus précisément », a déclaré le Dr Turk, « cette séance se concentrera sur l’utilisation de l’IA générative en science, à la fois comme force de transformation dans la poursuite de la science et aussi comme risque potentiel de perturbation. »

La Dre Rebecca Willett a commencé sa présentation en expliquant comment l’IA générative peut être exploitée pour soutenir le processus de découverte scientifique. Elle s’est d’abord concentrée sur le fonctionnement des modèles génératifs. L'image ci-dessous tirée des diapositives du Dr Willett montre comment un modèle de langage, tel que ChatGPT, évalue la probabilité qu'un mot apparaisse, compte tenu d'un ensemble de mots précédent, et comment un modèle de génération d'images, tel que DALL-E 2, génère une image. à partir d'une invite donnée en utilisant des distributions de probabilité apprises à partir de milliards d'images au cours de la formation.

"En utilisant ce principe de distributions de probabilité, qui sous-tend tous les modèles génératifs, ces modèles peuvent être appliqués à des idées scientifiques, telles que la génération de scénarios climatiques possibles compte tenu du climat actuel et des politiques potentielles, ou la génération de nouveaux microbiomes avec des fonctionnalités ciblées, telles que celui qui est particulièrement efficace pour décomposer les plastiques », explique le Dr Willett.

Cependant, il ne suffit pas d’utiliser des outils génératifs disponibles dans le commerce, tels que ChatGPT ou DALL-E 2, pour la recherche scientifique. Ces outils ont été créés dans un cadre très différent du contexte dans lequel évoluent les scientifiques. Une différence évidente entre un modèle génératif standard et un modèle scientifique réside dans les données. En science, il existe souvent très peu de données sur lesquelles fonder des hypothèses. Les données scientifiques proviennent généralement de simulations et d’expériences, qui sont souvent coûteuses et longues. En raison de ces limitations, les scientifiques doivent choisir avec soin les expériences à réaliser et comment maximiser l’efficacité et l’utilité de ces systèmes. En revanche, les modèles disponibles dans le commerce accordent beaucoup moins d’importance à la provenance des données plutôt qu’à maximiser la quantité de données sur lesquelles ils peuvent fonctionner. En science, l’exactitude des ensembles de données et leurs origines sont extrêmement importantes, car les scientifiques doivent justifier leurs recherches par des preuves empiriques solides.

« De plus, en sciences, nos objectifs ne se limitent pas à simplement produire des choses plausibles », explique le Dr Willett. "Nous devons comprendre la façon dont les choses fonctionnent en dehors de ce que nous avons observé jusqu'à présent." Cette approche est en contradiction avec les modèles d’IA génératifs qui traitent les données comme représentatives de l’ensemble des observations probables. L’intégration de modèles physiques et de contraintes dans l’IA générative permet de garantir qu’elle représentera mieux les phénomènes physiques.

Les modèles scientifiques doivent également être capables de capturer des événements rares. « Nous pouvons ignorer en toute sécurité de nombreux événements rares lorsque nous formons ChatGPT, mais en revanche, les événements rares sont souvent ce qui nous importe le plus dans le contexte scientifique, comme dans un modèle climatique qui prédit des événements météorologiques rares. Si nous utilisons un modèle génératif qui évite les événements rares et, par exemple, ne prédit jamais un ouragan, alors ce modèle ne sera pas très utile en pratique.

Un défi connexe consiste à développer des modèles d’IA génératifs pour les processus chaotiques, sensibles aux conditions initiales. Le Dr Willett a montré la vidéo ci-dessous, qui montre deux particules se déplaçant dans l'espace selon les équations de Lorenz 63. Ces équations sont déterministes et non aléatoires, mais étant donné deux emplacements de départ légèrement différents, vous pouvez voir qu'à un moment donné, les deux particules peuvent se trouver à des emplacements très différents. Développer des modèles d'IA génératifs qui prédisent le déroulement exact de tels processus, qui surviennent dans les domaines de la science du climat, des turbulences et de la dynamique des réseaux, est fondamentalement difficile, mais de nouvelles approches de modélisation générative peuvent garantir que les processus générés partagent des caractéristiques statistiques clés avec des données scientifiques réelles.

[Contenu intégré]

Enfin, le Dr Willett a abordé le fait que les données scientifiques couvrent souvent une vaste gamme d'échelles spatiales et temporelles. Par exemple, en science des matériaux, les chercheurs étudient les matériaux à l’échelle nanométrique pour les mononymes jusqu’aux systèmes à grande échelle, comme un avion entier. "Cette gamme d'échelles est très différente des données utilisées dans les modèles disponibles dans le commerce, et nous devons réfléchir à la manière dont nous construisons ces modèles génératifs de manière à affecter avec précision ces interactions entre les échelles".

« Les modèles génératifs sont l'avenir de la science », déclare le Dr Willett, « mais pour garantir qu'ils sont utilisés efficacement, nous devons faire des progrès fondamentaux dans l'IA et aller au-delà du simple branchement des données dans ChatGPT ».

Merci beaucoup d'avoir lu, et veuillez vous connecter demain pour lire le récapitulatif de la présentation du Dr Markus Buehler sur l'IA générative en mécanobiologie.

spot_img

Dernières informations

spot_img