Logo Zéphyrnet

DeepMind vise à automatiser la découverte de nouveaux algorithmes

Date :

DeepMind, propriété de Google, a appliqué des techniques d'apprentissage renforcées à la multiplication de matrices mathématiques, battant certains algorithmes créés par l'homme qui ont duré 50 ans et travaillant à l'amélioration de l'informatique.

Fondé à Londres en 2010, DeepMind est devenu célèbre pour avoir battu le champion du monde au jeu de société Go avec son AlphaGo l'IA et relever le défi époustouflant du repliement des protéines avec AlphaFold.

Dans un mouvement de roues dans les roues, il a depuis jeté son dévolu sur les problèmes mathématiques eux-mêmes.

Un projet réussi a été de automatiser la découverte d'algorithmes qui agissent comme des raccourcis lors de la multiplication de matrices – la cause de maux de tête pour de nombreux adolescents étudiants en mathématiques.

Depuis des années, les mathématiciens appliquent des algorithmes à ces multiplications de tableaux complexes, dont certains sont utilisés en informatique.

Le chercheur de DeepMind, Alhussein Fawzi, et ses collègues ont utilisé le renforcement profond pour redécouvrir des algorithmes antérieurs et en trouver de nouveaux. La technique a créé un système, baptisé AlphaTensor, qui joue à un jeu dans lequel le but est de trouver la meilleure approche pour multiplier deux matrices. Si l’agent IA réussit, il est renforcé pour rendre le succès futur plus probable.

Dans ce cas, l’agent affronte des énigmes sous la forme d’un tenseur 3D ou d’une grille de nombres, qu’il doit réaliser en un minimum de mouvements. Chaque étape représente une étape dans la résolution du puzzle matriciel, qui peut contenir des milliards de mouvements possibles.

Fawzi a déclaré lors d'un point de presse cette semaine que cartographier l'espace de la découverte algorithmique était un travail difficile, même si s'y retrouver était encore plus difficile. Néanmoins, les recherches qui en ont résulté ont permis de développer de nouveaux algorithmes pour résoudre des problèmes qui n'ont pas été améliorés depuis plus de 50 ans de recherche humaine, a-t-il déclaré.

Les chercheurs affirment que la technique pourrait bénéficier aux tâches informatiques utilisant des algorithmes de multiplication et démontrer comment l’apprentissage par renforcement peut être utilisé pour trouver des solutions nouvelles et inattendues à des problèmes connus, tout en notant certaines limites. Par exemple, des composants prédéfinis sont nécessaires pour éviter que le système ne manque un sous-ensemble d'algorithmes efficaces.

Les sceptiques peuvent pointer vers l'application d'AlphaFold, qui a promis des percées dans la découverte de médicaments via la recherche sur les protéines soutenue par l'IA. Bien que le modèle ait prédit presque toutes les structures protéiques connues découvertes, son capacité à aider les scientifiques découvrent de nouveaux médicaments qui n’ont pas encore fait leurs preuves. ®

spot_img

Dernières informations

spot_img