Logo Zéphyrnet

Le monde « réel » : les agents de l'IA planifient des fêtes et se demandent des rendez-vous dans une ville virtuelle 16 bits

Date :

"C'est l'histoire vraie de 25 personnages de jeux vidéo choisis pour vivre dans une ville et faire enregistrer leur vie… pour découvrir ce qui se passe lorsque les ordinateurs cessent d'être polis… et commencer à devenir réel. »

Des chercheurs de Google et de Stanford ont récemment créé une sorte de nouvelle émission de téléréalité, avec des agents d'IA au lieu de personnes.

En utilisant le chatbot viral ChatGPT d'OpenAI et un code personnalisé, ils ont généré 25 personnages IA avec des histoires, des personnalités, des souvenirs et des motivations. Ensuite, les chercheurs ont déposé ces personnages dans une ville de jeux vidéo 16 bits et les ont laissés vivre leur vie. Et alors arriver quand les ordinateurs commencent à devenir réels ?

"Les agents génératifs se réveillent, préparent le petit-déjeuner et se rendent au travail", ont écrit les chercheurs dans un papier préimprimé posté sur l'arXiv décrivant le projet. « Les artistes peignent, tandis que les auteurs écrivent ; ils forment des opinions, se remarquent et engagent des conversations ; ils se souviennent et réfléchissent aux jours passés alors qu'ils planifient le lendemain.

Pas exactement une télévision fascinante, mais étonnamment réaliste pour ce qui se résume à un énorme algorithme d'apprentissage automatique… qui se parle à lui-même.

La ville de l'IA, Smallville, n'est que le dernier développement d'un moment fascinant pour l'IA. Alors que la version de base de ChatGPT prend les interactions une à la fois - écrivez une invite, obtenez une réponse -plusieurs projets annexes combinent ChatGPT avec d'autres programmes pour effectuer automatiquement une cascade de tâches. Il peut s'agir de créer une liste de tâches et de cocher les éléments de la liste un par un, de rechercher des informations sur Google et de résumer les résultats, écrire et déboguer du code, même en critiquant et en corrigeant la propre sortie de ChatGPT.

Ce sont ces types d'interactions en cascade qui font également fonctionner Smallville. Les chercheurs ont conçu une série d'algorithmes compagnons qui, ensemble, alimentent des agents d'IA simples capables de stocker des souvenirs, puis de réfléchir, de planifier et d'agir en fonction de ces souvenirs.

La première étape consiste à créer un personnage. Pour ce faire, les chercheurs écrivent une mémoire fondamentale sous la forme d'une invite détaillée décrivant la personnalité, les motivations et la situation de ce personnage. Voici un exemple abrégé tiré du journal : « John Lin est un commerçant en pharmacie au Willow Market and Pharmacy qui aime aider les gens. Il cherche toujours des moyens de faciliter le processus d'obtention de médicaments pour ses clients. John Lin vit avec sa femme, Mei Lin, qui est professeur d'université, et son fils, Eddy Lin, qui étudie la théorie musicale.

Mais la caractérisation ne suffit pas. Chaque personnage a aussi besoin d'un souvenir. Ainsi, l'équipe a créé une base de données appelée « flux de mémoire » qui enregistre les expériences d'un agent dans le langage courant.

Lors de l'accès au flux de mémoire, un agent fait apparaître les souvenirs les plus récents, les plus importants et les plus pertinents. Les événements de la plus haute « importance » sont enregistrés dans des souvenirs séparés que les chercheurs appellent des « réflexions ». Enfin, l'agent crée des plans à l'aide d'un ensemble d'invites de plus en plus détaillées qui divisent la journée en incréments de temps de plus en plus petits. Chaque plan de haut niveau est ainsi divisé en étapes plus petites. Ces plans sont également ajoutés au flux de mémoire pour être récupérés.

Au fur et à mesure que l'agent poursuit sa journée - traduisant les invites textuelles en actions et en conversations avec d'autres personnages du jeu - il exploite son flux de mémoire d'expériences, de réflexions et de plans pour informer chaque action et conversation. Pendant ce temps, de nouvelles expériences reviennent dans le flux. Le processus est assez simple, mais lorsqu'il est combiné avec les grands modèles de langage d'OpenAI via l'interface ChatGPT, le résultat est étonnamment complexe, voire émergent.

Lors d'un test, l'équipe a incité un personnage, Isabella, à organiser une fête pour la Saint-Valentin et une autre, Maria, à avoir le béguin pour un troisième, Klaus. Isabella a ensuite invité des amis et des clients à la fête, décoré le café et recruté Maria, son amie, pour l'aider. Maria mentionne la fête à Klaus et l'invite à l'accompagner. Cinq agents assistent à la fête - mais tout aussi humains - plusieurs flocons ou ne se présentent tout simplement pas.

Au-delà des graines initiales - le plan du parti et le coup de cœur - le reste a émergé de lui-même. "Les comportements sociaux consistant à passer le mot, à décorer, à se demander, à arriver à la fête et à interagir les uns avec les autres à la fête ont été initiés par l'architecture de l'agent", ont écrit les auteurs.

Il est remarquable que cela puisse être accompli, pour la plupart, en divisant simplement ChatGPT en un certain nombre de parties fonctionnelles et de personnalités et en les jouant les unes sur les autres.

Les jeux vidéo sont l'application la plus évidente de ce type d'interaction crédible et ouverte, en particulier lorsqu'ils sont combinés avec des avatars haute fidélité. Les personnages non-joueurs pourraient évoluer d'interactions scénarisées à conversations avec des personnalités convaincantes.

Les chercheurs avertissent que les gens peuvent être tentés de nouer des relations avec des personnages réalistes—une tendance qui est déjà là– et les concepteurs doivent prendre soin d'ajouter des garde-fous de contenu et toujours exclure lorsqu'un personnage est un agent. D'autres risques incluent ceux applicables à l'IA générative au sens large, tels que la propagation de la désinformation et la dépendance excessive à l'égard des agents.

Cette approche peut-être pas assez pratique travailler dans les jeux vidéo grand public pour l'instant, mais cela suggère qu'un tel avenir est probablement à venir.

Il en va de même pour la tendance plus large chez les agents. Les implémentations actuelles sont encore limitées, malgré le battage médiatique. Mais connecter plusieurs algorithmes—complet avec plugins et accès internet— peut permettre la création d'agents capables, semblables à des assistants, capables d'effectuer des tâches en plusieurs étapes à la demande. À plus long terme, une telle IA automatisée pourrait être très utile, mais présenter également le risque que des algorithmes mal alignés causent des problèmes imprévus à grande échelle.

Pour l'instant, ce qui est le plus évident, c'est comment la danse entre l'IA générative et une communauté de développeurs et de chercheurs continue de faire émerger de nouvelles directions et capacités surprenantes - une boucle de rétroaction qui ne montre aucun signe de ralentissement pour l'instant.

Crédit d'image : "Agents génératifs : simulacres interactifs du comportement humain", Joon Sung Park, Joseph C. O'Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, Michael S. Bernstein

spot_img

Dernières informations

spot_img