Logo Zéphyrnet

La révolution de l'IA générative dans les jeux

Date :

Pour comprendre à quel point le jeu est sur le point d'être radicalement transformé par l'IA générative, ne cherchez pas plus loin que ce récent après Twitter by @emmanuel_2m. Dans cet article, il explore l'utilisation de Stable Diffusion + Dreambooth, des modèles populaires d'IA générative 2D, pour générer des images de potions pour un jeu hypothétique.

Ce qui est transformateur dans ce travail, ce n'est pas seulement qu'il permet d'économiser du temps et de l'argent tout en offrant de la qualité – brisant ainsi le triangle classique « vous ne pouvez avoir que deux de coût, de qualité ou de vitesse ». Les artistes créent désormais des images de haute qualité en quelques heures qui, autrement, prendraient des semaines à générer à la main. Ce qui est vraiment transformateur, c'est que :

  • Ce pouvoir créatif est désormais accessible à tous ceux qui peuvent apprendre quelques outils simples.
  • Ces outils peuvent créer un nombre infini de variations de manière hautement itérative.
  • Une fois formé, le processus est en temps réel - les résultats sont disponibles presque instantanément.

Il n'y a pas eu de technologie aussi révolutionnaire pour les jeux depuis la 3D en temps réel. Passez du temps à parler aux créateurs de jeux, et le sentiment d'excitation et d'émerveillement est palpable. Alors, où va cette technologie ? Et comment cela transformera-t-il le jeu ? Voyons d'abord ce qu'est l'IA générative ?

TABLE DES MATIÈRES

Qu'est-ce que l'IA générative

L'IA générative est une catégorie d'apprentissage automatique où les ordinateurs peuvent générer un nouveau contenu original en réponse aux invites de l'utilisateur. Aujourd'hui, le texte et les images sont les applications les plus matures de cette technologie, mais des travaux sont en cours dans pratiquement tous les domaines créatifs, de l'animation aux effets sonores, en passant par la musique, et même la création de personnages virtuels aux personnalités pleinement étoffées.

L'IA n'est pas nouvelle dans les jeux, bien sûr. Même les premiers jeux, comme Atari's Pong, avaient des adversaires contrôlés par ordinateur pour défier le joueur. Ces ennemis virtuels, cependant, n'exécutaient pas l'IA telle que nous la connaissons aujourd'hui. Il s'agissait simplement de procédures scénarisées conçues par des concepteurs de jeux. Ils simulaient un adversaire artificiellement intelligent, mais ils ne pouvaient pas apprendre, et ils n'étaient aussi bons que les programmeurs qui les avaient construits.

Ce qui est différent maintenant, c'est la quantité de puissance de calcul disponible, grâce à des microprocesseurs plus rapides et au cloud. Avec cette puissance, il est possible de construire de grands réseaux de neurones capables d'identifier des modèles et des représentations dans des domaines très complexes.

Ce billet de blog comporte deux parties :

  • La partie I se compose de nos observations et prédictions pour le domaine de l'IA générative pour les jeux.
  • La partie II est notre carte du marché de l'espace, décrivant les différents segments et identifiant les entreprises clés dans chacun.

TABLE DES MATIÈRES

Hypothèses

Tout d'abord, explorons quelques hypothèses sous-jacentes au reste de cet article de blog :

1. La quantité de recherche effectuée en général sur l'IA continuera de croître, créant des techniques toujours plus efficaces

Considérez ce graphique du nombre d'articles universitaires publiés sur l'apprentissage automatique ou l'intelligence artificielle dans le Archives arXiv chaque mois:

Comme vous pouvez le constater, le nombre d'articles augmente de façon exponentielle, sans aucun signe de ralentissement. Et cela inclut uniquement les articles publiés - une grande partie de la recherche n'est même jamais publiée, allant directement aux modèles open source ou à la R&D de produits. Le résultat est une explosion d'intérêt et d'innovation.

2. De tous les divertissements, les jeux seront les plus touchés par l'IA générative

Les jeux sont la forme de divertissement la plus complexe, en termes de nombre de types d'actifs impliqués (art 2D, art 3D, effets sonores, musique, dialogue, etc.). Les jeux sont également les plus interactifs, avec un fort accent sur les expériences en temps réel. Cela crée une forte barrière à l'entrée pour les nouveaux développeurs de jeux, ainsi qu'un coût élevé pour produire un jeu moderne en tête des charts. Cela crée également une formidable opportunité pour la perturbation de l'IA générative.

Considérez un jeu comme 2 de Red Dead Redemption, l'un des jeux les plus chers jamais produits, coûtant près de 500 millions de dollars à fabriquer. Il est facile de comprendre pourquoi - il possède l'un des mondes virtuels les plus beaux et les plus complets de tous les jeux du marché. Il a également fallu près de 8 ans pour le construire, comprend plus de 1,000 30 personnages non jouables (chacun avec sa propre personnalité, ses illustrations et son doubleur), un monde de près de 100 miles carrés, plus de 6 missions réparties sur 60 chapitres, et près de 100 heures de musique créées par plus de XNUMX musiciens. Tout dans ce jeu est grand.

Comparez maintenant Red Dead Redemption 2 à Microsoft Flight Simulator, qui n'est pas seulement grand, c'est énorme. Microsoft Flight Simulator permet aux joueurs de voler autour de la planète Terre entière, les 197 millions de miles carrés de celle-ci. Comment Microsoft a-t-il construit un jeu aussi massif ? En laissant une IA le faire. Microsoft s'est associé à blackshark.ai, et formé une IA pour générer un monde 3D photoréaliste à partir d'images satellites 2D.

Il s'agit d'un exemple de jeu qui aurait littéralement été impossible à construire sans l'utilisation de l'IA, et qui bénéficie en outre du fait que ces modèles peuvent être continuellement améliorés au fil du temps. Par exemple, ils peuvent améliorer le modèle de « passage supérieur en trèfle autoroutier », relancer l'intégralité du processus de construction, et du coup, tous les viaducs autoroutiers de la planète entière sont améliorés.

3. Il y aura un modèle d'IA génératif pour chaque actif impliqué dans la production de jeux

Jusqu'à présent, les générateurs d'images 2D tels que Stable Diffusion ou MidJourney ont capturé la majorité de l'enthousiasme populaire suscité par l'IA générative en raison de la nature accrocheuse des images qu'ils peuvent générer. Mais il existe déjà des modèles d'IA générative pour pratiquement tous les actifs impliqués dans les jeux, des modèles 3D aux animations de personnages, en passant par les dialogues et la musique. La seconde moitié de cet article de blog comprend une carte du marché mettant en évidence certaines des entreprises se concentrant sur chaque type de contenu.

4. Le prix du contenu chutera de manière spectaculaire, atteignant effectivement zéro dans certains cas.

Lorsque vous discutez avec des développeurs de jeux qui expérimentent l'intégration de l'IA générative dans leur pipeline de production, la plus grande excitation concerne la réduction spectaculaire du temps et des coûts. Un développeur nous a dit que son temps pour générer un concept art pour une seule image, du début à la fin, est passé de 3 semaines à une seule heure : une réduction de 120 à 1. Nous pensons que des économies similaires seront possibles sur l'ensemble du pipeline de production.

Pour être clair, les artistes ne risquent pas d'être remplacés. Cela signifie que les artistes n'ont plus besoin de faire tout le travail eux-mêmes : ils peuvent désormais définir la direction créative initiale, puis confier une grande partie de l'exécution technique et chronophage à une IA. En cela, ils ressemblent aux peintres cel des premiers jours de l'animation dessinée à la main dans lesquels des «encreurs» hautement qualifiés dessinaient les contours de l'animation, puis des armées de «peintres» à moindre coût feraient le travail fastidieux de peindre le cellules d'animation, remplissant les lignes. C'est le "auto-complétion" pour la création de jeux.

5. Nous n'en sommes qu'aux balbutiements de cette révolution et beaucoup de pratiques doivent encore être affinées

Malgré toute l'effervescence récente, nous n'en sommes encore qu'à la ligne de départ. Il y a énormément de travail à faire alors que nous découvrons comment exploiter cette nouvelle technologie pour les jeux, et d'énormes opportunités seront générées pour les entreprises qui entreront rapidement dans ce nouvel espace.

TABLE DES MATIÈRES

Prédictions

Compte tenu de ces hypothèses, voici quelques prédictions sur la façon dont l'industrie du jeu pourrait être transformée :

1. Apprendre à utiliser efficacement l'IA générative deviendra une compétence commercialisable

Nous voyons déjà certains expérimentateurs utiliser l'IA générative plus efficacement que d'autres. Pour tirer le meilleur parti de cette nouvelle technologie, il faut utiliser une variété d'outils et de techniques et savoir rebondir entre eux. Nous prévoyons que cela deviendra une compétence commercialisable, combinant la vision créative d'un artiste avec les compétences techniques d'un programmeur.

Chris Anderson est célèbre pour avoir dit : "Chaque abondance crée une nouvelle rareté". À mesure que le contenu devient abondant, nous pensons que ce sont les artistes qui savent travailler le plus efficacement et en collaboration avec les outils d'IA qui seront les plus rares.

Par exemple, l'utilisation de l'IA générative pour les illustrations de production comporte des défis particuliers, notamment :

  • La cohérence. Avec n'importe quel actif de production, vous devez être en mesure d'apporter des modifications ou des modifications à l'actif en cours de route. Avec un outil d'IA, cela signifie qu'il faut être capable de reproduire l'actif avec la même invite, afin que vous puissiez ensuite apporter des modifications. Cela peut être délicat car la même invite peut générer des résultats très différents.
  • Style. Il est important que toutes les illustrations d'un jeu donné aient un style cohérent, ce qui signifie que vos outils doivent être entraînés ou liés à votre style donné.

2. L'abaissement des barrières se traduira par une plus grande prise de risques et une exploration créative

Nous pourrions bientôt entrer dans un nouvel "âge d'or" du développement de jeux, dans lequel une barrière à l'entrée plus faible entraîne une explosion de jeux plus innovants et créatifs. Non seulement parce que des coûts de production plus faibles entraînent une réduction des risques, mais parce que ces outils libèrent la capacité de créer du contenu de haute qualité pour un public plus large. Ce qui mène à la prochaine prédiction…

3. Une montée en puissance des "micro studios de jeux" assistés par l'IA

Armés d'outils et de services d'IA générative, nous commencerons à voir des jeux commerciaux plus viables produits par de minuscules "micro studios" de seulement 1 ou 2 employés. L'idée d'un petit studio de jeux indépendant n'est pas nouvelle - jeu à succès Among Us a été créé par le studio Innersloth avec seulement 5 employés - mais la taille et l'échelle des jeux que ces petits studios peuvent créer vont augmenter. Cela se traduira par…

4. Une augmentation du nombre de jeux sortis chaque année

Le succès d'Unity et de Roblox a montré que la fourniture d'outils créatifs puissants entraîne la création de plus de jeux. L'IA générative abaissera encore plus la barre, créant un nombre encore plus grand de jeux. L'industrie souffre déjà de défis de découverte - plus de 10,000 XNUMX jeux ont été ajoutés à Steam l'année dernière seulement - et cela mettra encore plus de pression sur la découverte. Mais nous verrons aussi…

5. Nouveaux types de jeux créés qui n'étaient pas possibles avant l'IA générative

Nous verrons de nouveaux genres de jeux inventés qui n'étaient tout simplement pas possibles sans l'IA générative. Nous avons déjà parlé du simulateur de vol de Microsoft, mais il y aura des genres entièrement nouveaux inventés qui dépendent de la génération en temps réel de nouveaux contenus.

Considérer Flèchemancien, par Pinceau. Il s'agit d'un jeu RPG qui propose des personnages créés par l'IA pour un nouveau gameplay pratiquement illimité.

Nous connaissons également un autre développeur de jeux qui utilise l'IA pour permettre aux joueurs de créer leur propre avatar dans le jeu. Auparavant, ils disposaient d'une collection d'images d'avatar dessinées à la main que les joueurs pouvaient mélanger et assortir pour créer leur avatar. Désormais, ils l'ont entièrement supprimée et génèrent simplement l'image de l'avatar à partir de la description du joueur. Laisser les joueurs générer du contenu via une IA est plus sûr que de laisser les joueurs télécharger leur propre contenu à partir de zéro, car l'IA peut être formée pour éviter de créer du contenu offensant, tout en donnant aux joueurs un plus grand sentiment d'appartenance.

6. La valeur reviendra aux outils d'IA spécifiques à l'industrie, et pas seulement aux modèles fondamentaux

L'excitation et le buzz autour des modèles fondamentaux comme Stable Diffusion et Midjourney génèrent des valorisations époustouflantes, mais le flot continu de nouvelles recherches garantit que de nouveaux modèles vont et viennent à mesure que de nouvelles techniques sont affinées. Considérez le trafic de recherche de sites Web vers 3 modèles populaires d'IA générative : Dall-E, Midjourney et Stable Diffusion. Chaque nouveau modèle est à son tour mis à l'honneur.

Une approche alternative peut consister à créer des suites d'outils alignées sur l'industrie qui se concentrent sur les besoins d'IA générative d'une industrie donnée, avec une compréhension approfondie d'un public particulier et une intégration riche dans les pipelines de production existants (tels que Unity ou Unreal pour les jeux).

Un bon exemple est Runway qui cible les besoins des créateurs de vidéos avec des outils assistés par l'IA tels que le montage vidéo, la suppression de l'écran vert, l'inpainting et le suivi de mouvement. Des outils comme celui-ci peuvent créer et monétiser un public donné, en ajoutant de nouveaux modèles au fil du temps. Nous n'avons pas encore vu émerger une suite telle que Runway pour les jeux, mais nous savons que c'est un espace de développement actif.

7. Des contestations judiciaires arrivent

Ce que tous ces modèles d'IA générative ont en commun, c'est qu'ils sont formés à l'aide d'énormes ensembles de données de contenu, souvent créés en grattant Internet lui-même. Stable Diffusion, par exemple, est formé sur plus de 5 milliards de paires image/légende, extraites du Web.

Pour le moment, ces modèles prétendent fonctionner selon la doctrine du droit d'auteur "fair use", mais cet argument n'a pas encore été définitivement testé devant les tribunaux. Il semble clair que les contestations judiciaires arrivent ce qui changera probablement le paysage de l'IA générative.

Il est possible que les grands studios recherchent un avantage concurrentiel en créant des modèles propriétaires basés sur du contenu interne sur lequel ils ont clairement le droit et le titre. Microsoft, par exemple, est particulièrement bien positionné ici avec 23 studios propriétaires aujourd'hui, et 7 autres après son acquisition d'Activision finalisée.

8. La programmation ne sera pas bouleversée aussi profondément que le contenu artistique – du moins pas encore

L'ingénierie logicielle est l'autre coût majeur du développement de jeux, mais comme nos collègues de l'équipe a16z Enterprise l'ont partagé dans leur récent article de blog, L'art n'est pas mort, c'est juste généré par la machine, la génération de code avec un modèle d'IA nécessite davantage de tests et de vérifications, et présente donc une amélioration de la productivité moindre que la génération d'éléments créatifs. Des outils de codage tels que Copilot peuvent apporter des améliorations de performances modérées aux ingénieurs, mais n'auront pas le même impact… du moins de sitôt.

TABLE DES MATIÈRES

Recommandations

Sur la base de ces prévisions, nous proposons les recommandations suivantes :

1. Commencez à explorer l'IA générative maintenant

Il faudra un certain temps pour comprendre comment tirer pleinement parti de la puissance de cette prochaine révolution de l'IA générative. Les entreprises qui commencent maintenant auront un avantage plus tard. Nous connaissons plusieurs studios qui ont des projets expérimentaux internes en cours pour explorer l'impact de ces techniques sur la production.

2. Rechercher des opportunités de cartographie du marché

Certaines parties de notre carte du marché sont déjà très encombrées, comme les animations ou la parole et le dialogue, mais d'autres domaines sont largement ouverts. Nous encourageons les entrepreneurs intéressés par cet espace à concentrer leurs efforts sur les domaines encore inexplorés, comme « Runway for Games ».

TABLE DES MATIÈRES

État actuel du marché

Nous avons créé une carte du marché pour capturer une liste des entreprises que nous avons identifiées dans chacune de ces catégories où nous voyons l'IA générative impacter les jeux. Cet article de blog passe en revue chacune de ces catégories, l'expliquant un peu plus en détail et mettant en évidence les entreprises les plus intéressantes de chaque catégorie.

TABLE DES MATIÈRES

Images 2D

La génération d'images 2D à partir d'invites de texte est déjà l'un des domaines les plus largement appliqués de l'IA générative. Des outils comme À mi-parcours, Diffusion stableet De E 2 peuvent générer des images 2D de haute qualité à partir de texte et ont déjà trouvé leur place dans la production de jeux à plusieurs étapes du cycle de vie du jeu.

Concept Art

Les outils d'IA générative sont excellents pour "l'idéation" ou pour aider les non-artistes, comme les concepteurs de jeux, à explorer très rapidement des concepts et des idées pour générer des illustrations conceptuelles, un élément clé du processus de production. Par exemple, un studio (restant anonyme) utilise plusieurs de ces outils ensemble pour accélérer radicalement son processus d'art conceptuel, prenant une seule journée pour créer une image qui aurait auparavant pris jusqu'à 3 semaines.

  • Tout d'abord, leurs concepteurs de jeux utilisent Midjourney pour explorer différentes idées et générer des images qu'ils trouvent inspirantes.
  • Ceux-ci sont remis à un artiste conceptuel professionnel qui les assemble et peint le résultat pour créer une seule image cohérente – qui est ensuite introduite dans Stable Diffusion pour créer un tas de variations.
  • Ils discutent de ces variations, en choisissent une, peignent manuellement certaines modifications, puis répètent le processus jusqu'à ce qu'ils soient satisfaits du résultat.
  • À ce stade, retransmettez cette image dans Stable Diffusion une dernière fois pour la «mettre à l'échelle» afin de créer l'œuvre d'art finale.

Production artistique 2D

Certains studios expérimentent déjà l'utilisation des mêmes outils pour les illustrations de production dans le jeu. Par exemple, voici une belle tutoriel d'Albert Bozesan sur l'utilisation de Stable Diffusion pour créer des ressources 2D dans le jeu.

TABLE DES MATIÈRES

Oeuvre 3D

Les actifs 3D sont la pierre angulaire de tous les jeux modernes, ainsi que du métaverse à venir. Un monde virtuel, ou niveau de jeu, n'est essentiellement qu'une collection d'éléments 3D, placés et modifiés pour peupler l'environnement. Cependant, la création d'un élément 3D est plus complexe que la création d'une image 2D et implique plusieurs étapes, notamment la création d'un modèle 3D et l'ajout de textures et d'effets. Pour les personnages animés, cela implique également de créer un "squelette" interne, puis de créer des animations au-dessus de ce squelette.

Nous voyons plusieurs startups différentes passer après chaque étape de ce processus de création d'actifs 3D, y compris la création de modèles, l'animation de personnages et la construction de niveaux. Cependant, ce n'est pas encore un problème résolu - aucune des solutions n'est encore prête à être entièrement intégrée à la production.

Actifs 3D

Les startups essayant de résoudre le problème de création de modèles 3D incluent Kaedim, Mirageet Hypothétique. Les grandes entreprises se penchent également sur le problème, y compris Nvidia Obtenir3D et d'Autodesk ClipForge. Kaedim et Get3d se concentrent sur l'image en 3D ; ClipForge et Mirage se concentrent sur le texte en 3D, tandis qu'Hypothetic s'intéresse à la fois à la recherche de texte en 3D, ainsi qu'à l'image en 3D.

Textures 3D

Un modèle 3D ne semble aussi réaliste que la texture ou les matériaux appliqués au maillage. Décider quelle texture de pierre moussue et altérée appliquer à un modèle de château médiéval peut complètement changer l'apparence d'une scène. Les textures contiennent des métadonnées sur la façon dont la lumière réagit au matériau (c'est-à-dire la rugosité, la brillance, etc.). Permettre aux artistes de générer facilement des textures basées sur des invites de texte ou d'image sera extrêmement précieux pour augmenter la vitesse d'itération dans le processus de création. Plusieurs équipes poursuivent cette opportunité dont BaryumAI, Ponzuet Laboratoire d'armure.

Animation

La création d'animations de qualité est l'une des étapes les plus longues, les plus coûteuses et les plus habiles du processus de création d'un jeu. Une façon de réduire les coûts et de créer une animation plus réaliste consiste à utiliser la capture de mouvement, dans laquelle vous placez un acteur ou un danseur dans une combinaison de capture de mouvement et enregistrez-le en mouvement dans une étape de capture de mouvement spécialement instrumentée.

Nous voyons maintenant des modèles d'IA générative capables de capturer une animation directement à partir d'une vidéo. C'est beaucoup plus efficace, à la fois parce qu'il élimine le besoin d'une plate-forme de capture de mouvement coûteuse et parce que cela signifie que vous pouvez capturer l'animation à partir de vidéos existantes. Un autre aspect passionnant de ces modèles est qu'ils peuvent également être utilisés pour appliquer des filtres à des animations existantes, par exemple en les faisant paraître ivres, vieux ou heureux. Les entreprises qui recherchent cet espace incluent Kinetix, Mouvement profond, Radical, Déplacer Aiet Plask.

Conception de niveaux et construction de mondes

L'un des aspects les plus chronophages de la création de jeux consiste à créer le monde d'un jeu, une tâche à laquelle l'IA générative devrait être bien adaptée. Des jeux comme Minecraft, No Man's Sky et Diablo sont déjà connus pour utiliser des techniques procédurales pour générer leurs niveaux, dans lesquels les niveaux sont créés de manière aléatoire, différents à chaque fois, mais en suivant les règles établies par le concepteur de niveau. L'un des principaux arguments de vente du nouveau moteur de jeu Unreal 5 est sa collection d'outils procéduraux pour la conception d'un monde ouvert, tels que le placement du feuillage.

Nous avons vu quelques initiatives dans l'espace, comme Prométhéen, MLXAR, ou Meta Robot constructeur, et pense que ce n'est qu'une question de temps avant que les techniques génératives remplacent largement les techniques procédurales. Il y a eu des recherches universitaires dans l'espace pendant un certain temps, y compris techniques génératives pour Minecraft or conception de niveaux dans Doom.

Une autre raison impérieuse d'attendre avec impatience les outils d'IA génératifs pour la conception de niveaux serait la possibilité de créer des niveaux et des mondes dans différents styles. Vous pouvez imaginer demander à des outils de générer un monde dans l'ère des clapets des années 1920 à New York, contre un avenir dystopique de blade-runner-esque, contre un monde fantastique à la Tolkien.

Les concepts suivants ont été générés par Midjourney à l'aide de l'invite "un niveau de jeu dans le style de..."

Audio

Le son et la musique font partie intégrante de l'expérience de jeu. Nous commençons à voir des entreprises utiliser l'IA générative pour générer de l'audio afin de compléter le travail déjà en cours du côté graphique.

Effets sonores

Les effets sonores sont un domaine ouvert attrayant pour l'IA. Il y a eu papiers académiques explorer l'idée d'utiliser l'IA pour générer du "foley" dans le film (par exemple des pas) mais peu de produits commerciaux dans les jeux pour le moment.

Nous pensons que ce n'est qu'une question de temps, car la nature interactive des jeux en fait une application évidente pour l'IA générative, à la fois créant des effets sonores statiques dans le cadre de la production ("son de pistolet laser, dans le style de Star Wars"), et créer des effets sonores interactifs en temps réel au moment de l'exécution.

Considérez quelque chose d'aussi simple que de générer des bruits de pas pour le personnage du joueur. La plupart des jeux résolvent ce problème en incluant un petit nombre de bruits de pas préenregistrés : marcher sur l'herbe, marcher sur le gravier, courir sur l'herbe, courir sur le gravier, etc. Ceux-ci sont fastidieux à générer et à gérer, et sonnent répétitifs et irréalistes à l'exécution.

Une meilleure approche serait un modèle d'IA génératif en temps réel pour les effets sonores foley, qui peut générer des effets sonores appropriés, à la volée, légèrement différents à chaque fois, qui réagissent aux paramètres du jeu tels que la surface du sol, le poids du personnage, démarche, chaussures, etc.

Musique

La musique a toujours été un défi pour les jeux. C'est important, car cela peut aider à donner le ton émotionnel comme c'est le cas au cinéma ou à la télévision, mais comme les jeux peuvent durer des centaines, voire des milliers d'heures, cela peut rapidement devenir répétitif ou ennuyeux. De plus, en raison de la nature interactive des jeux, il peut être difficile pour la musique de correspondre précisément à ce qui se passe à l'écran à un moment donné.

La musique adaptative est un sujet dans l'audio des jeux depuis plus de deux décennies, remontant jusqu'à Microsoft "DirectMusique” système de création de musique interactive. DirectMusic n'a jamais été largement adapté, en grande partie à cause de la difficulté de composer dans le format. Seuls quelques jeux, comme celui de Monolith Personne ne vit pour toujours, ont créé des partitions véritablement interactives.

Nous voyons maintenant un certain nombre d'entreprises essayer de créer de la musique générée par l'IA, comme sonore, Musicien, Harmonaï, Album infiniet Aiva. Et tandis que certains outils aujourd'hui, comme juke-box par Open AI, sont très gourmands en calcul et ne peuvent pas fonctionner en temps réel, la majorité peut fonctionner en temps réel une fois le modèle initial construit.

Discours et dialogue

Il existe un grand nombre d'entreprises essayant de créer des voix réalistes pour les personnages du jeu. Ce n'est pas surprenant compte tenu de la longue histoire des tentatives de donner une voix aux ordinateurs grâce à la synthèse vocale. Les entreprises comprennent Sonantique, Coqui, Studios de réplique, Ressemble.ai, Lirespeaker.ai, Et beaucoup plus.

L'utilisation de l'IA générative pour la parole présente de multiples avantages, ce qui explique en partie pourquoi cet espace est si encombré.

  • Générez une boîte de dialogue à la volée. En règle générale, la parole dans les jeux est préenregistrée à partir d'acteurs vocaux, mais ceux-ci sont limités à des discours préenregistrés en conserve. Avec le dialogue génératif de l'IA, les personnages peuvent dire n'importe quoi, ce qui signifie qu'ils peuvent réagir pleinement à ce que font les joueurs. Combiné avec des modèles d'IA plus intelligents pour les PNJ (en dehors de la portée de ce blog, mais un domaine d'innovation tout aussi passionnant en ce moment), la promesse de jeux entièrement réactifs pour les joueurs arrive bientôt.
  • Jouer un rôle. De nombreux joueurs veulent incarner des personnages fantastiques qui ressemblent peu à leur identité réelle. Ce fantasme s'effondre cependant dès que les joueurs parlent de leur propre voix. L'utilisation d'une voix générée qui correspond à l'avatar du joueur entretient cette illusion.
    Contrôler. Au fur et à mesure que le discours est généré, vous pouvez contrôler la nuance de la voix comme son tambre, son inflexion, sa résonance émotionnelle, sa longueur de phonème, ses accents, etc.
  • Localisation Permet de traduire le dialogue dans n'importe quelle langue et de le prononcer de la même voix. Des entreprises comme Deepdub se concentrent spécifiquement sur ce créneau.

TABLE DES MATIÈRES

PNJ ou personnages joueurs

De nombreuses startups envisagent d'utiliser l'IA générative pour créer des personnages crédibles avec lesquels vous pouvez interagir, en partie parce qu'il s'agit d'un marché avec une telle applicabilité en dehors des jeux, comme les assistants virtuels ou les réceptionnistes.

Les efforts pour créer des personnages crédibles remontent aux débuts de la recherche sur l'IA. En fait, la définition du « test de Turing » classique pour l'intelligence artificielle est qu'un humain devrait être incapable de faire la distinction entre une conversation de chat avec une IA et un humain.

À ce stade, des centaines d'entreprises construisent des chatbots à usage général, dont beaucoup sont alimentés par les modèles de langage de type GPT-3. Un plus petit nombre essaie spécifiquement de créer des chatbots à des fins de divertissement, comme Replika ainsi que Anima qui essaient de se faire des amis virtuels. Le concept de sortir avec une petite amie virtuelle, tel qu'exploré dans le film Her, est peut-être plus proche que vous ne le pensez.

Nous assistons maintenant à la prochaine itération de ces plateformes de chatbot, telles que Charisme.ai, Convai.comou Inworld.ai, destiné à alimenter des personnages 3D entièrement rendus, avec des émotions et une agence, avec des outils permettant au créateur de donner des objectifs à ces personnages. Ceci est important s'ils doivent s'intégrer dans un jeu ou avoir une place narrative dans l'avancement de l'intrigue, plutôt que d'être purement une façade.

TABLE DES MATIÈRES

Plateformes tout-en-un

L'un des outils d'IA générative les plus performants au sens large est Runwayml.com, car il rassemble une large suite d'outils de création dans un seul package. Il n'existe actuellement aucune plateforme de ce type pour les jeux vidéo, et nous pensons qu'il s'agit d'une opportunité négligée. Nous aimerions investir dans une solution qui comprend :

  • Ensemble complet d'outils d'IA générative couvrant l'ensemble du processus de production. (code, génération d'assets, textures, audio, descriptions, etc.)
  • Étroitement intégré aux moteurs de jeu populaires comme Unreal et Unity.
  • Conçu pour s'intégrer dans un pipeline de production de jeux typique.

TABLE DES MATIÈRES

Conclusion

C'est un moment incroyable pour être un créateur de jeux ! Grâce en partie aux outils décrits dans cet article de blog, il n'a jamais été aussi simple de générer le contenu nécessaire à la création d'un jeu, même si votre jeu est aussi vaste que la planète entière !

Il est même possible d'imaginer un jour un jeu entièrement personnalisé, créé juste pour le joueur, basé exactement sur ce que le joueur veut. Cela fait longtemps partie de la science-fiction – comme le "AI Mind Game" dans Ender's Game, ou le holodeck dans Star Trek. Mais avec les outils décrits dans ce billet de blog qui progressent aussi rapidement qu'ils le sont, il n'est pas difficile d'imaginer que cette réalité est à nos portes.

Si vous êtes un fondateur, ou un fondateur potentiel, intéressé par la création d'une entreprise d'IA pour les jeux, contactez-nous ! Nous voulons de vos nouvelles!

***

Les opinions exprimées ici sont celles du personnel individuel d'AH Capital Management, LLC (« a16z ») cité et ne sont pas les opinions d'a16z ou de ses sociétés affiliées. Certaines informations contenues ici ont été obtenues de sources tierces, y compris de sociétés de portefeuille de fonds gérés par a16z. Bien qu'elles proviennent de sources considérées comme fiables, a16z n'a pas vérifié ces informations de manière indépendante et ne fait aucune déclaration quant à l'exactitude actuelle ou durable des informations ou à leur pertinence dans une situation donnée. De plus, ce contenu peut inclure des publicités de tiers ; a16z n'a pas examiné ces publicités et n'approuve aucun contenu publicitaire qu'elles contiennent.

Ce contenu est fourni à titre informatif uniquement et ne doit pas être considéré comme un conseil juridique, commercial, d'investissement ou fiscal. Vous devriez consulter vos propres conseillers sur ces questions. Les références à des titres ou à des actifs numériques sont uniquement à des fins d'illustration et ne constituent pas une recommandation d'investissement ou une offre de fournir des services de conseil en investissement. En outre, ce contenu n'est ni destiné ni destiné à être utilisé par des investisseurs ou des investisseurs potentiels, et ne peut en aucun cas être invoqué pour prendre une décision d'investir dans un fonds géré par a16z. (Une offre d'investissement dans un fonds a16z ne sera faite que par le mémorandum de placement privé, le contrat de souscription et toute autre documentation pertinente de ce fonds et doit être lu dans son intégralité.) Tous les investissements ou sociétés de portefeuille mentionnés, référencés ou décrits ne sont pas représentatifs de tous les investissements dans des véhicules gérés par a16z, et rien ne garantit que les investissements seront rentables ou que d'autres investissements réalisés à l'avenir auront des caractéristiques ou des résultats similaires. Une liste des investissements effectués par des fonds gérés par Andreessen Horowitz (à l'exclusion des investissements pour lesquels l'émetteur n'a pas autorisé a16z à divulguer publiquement ainsi que des investissements non annoncés dans des actifs numériques cotés en bourse) est disponible sur https://a16z.com/investments /.

Les tableaux et graphiques fournis ici sont uniquement à des fins d'information et ne doivent pas être utilisés pour prendre une décision d'investissement. Les performances passées ne représentent pas les résultats futurs. Le contenu ne parle qu'à la date indiquée. Toutes les projections, estimations, prévisions, objectifs, perspectives et/ou opinions exprimées dans ces documents sont susceptibles d'être modifiées sans préavis et peuvent différer ou être contraires aux opinions exprimées par d'autres. Veuillez consulter https://a16z.com/disclosures pour des informations supplémentaires importantes.

spot_img

Dernières informations

spot_img