Logo Zéphyrnet

Le chef de Google Cloud est vraiment enthousiasmé par cette histoire d'IA

Date :

Nuage suivant L'activité cloud de Google a atteint au dernier trimestre un chiffre d'affaires annuel de 36 milliards de dollars, soit plus de cinq fois ce qu'elle était il y a cinq ans, a annoncé mardi Sundar Pichai, PDG d'Alphabet, lors de la conférence Google Cloud Next 2024 à Las Vegas.

Bien que cela représente environ un tiers des revenus annuels générés par AWS et Microsoft Azure, ce n'est pas sans conséquence.

"Je souhaite souligner quelques raisons pour lesquelles Google Cloud montre tant de progrès", a déclaré Pichai. « L’un d’entre eux concerne nos investissements profonds dans l’IA. Nous savons depuis longtemps que l’IA va transformer tous les secteurs et toutes les entreprises, y compris la nôtre. »

Les logiciels d’IA, avec leur préférence pour une infrastructure GPU coûteuse, généreront beaucoup d’affaires pour les fournisseurs de services cloud. C'est la raison pour laquelle Google et ses concurrents du cloud ne se taisent pas. Mais c’est aussi potentiellement utile.

"Aujourd'hui, l'IA de Google peut scanner 100,000 XNUMX lignes de code en deux minutes pour repérer et corriger les bugs", a déclaré le géant de la recherche dans sa vidéo d'introduction. Spoiler : Il y a encore des bugs dans le logiciel.

"Aujourd'hui, l'IA a un impact positif sur la vie et comprend le travail comme vous le faites", poursuit la voix vidéo, ne faisant aucune mention de la manière dont l'IA a aggravé les choses : désinformation, hallucinations, utilisation de ressources comme l'énergie et l'eau, capturer le travail intellectuel d’autrui et le réutiliser à des fins lucratives sans autorisation et sans parti pris, entre autres problèmes.

Mais ce n'est pas ce que voulaient les dirigeants de Google parler de. Thomas Kurian, PDG de Google Cloud, est venu non pas enterrer l'IA, mais la vanter.

« Aujourd'hui, nous allons nous concentrer sur la manière dont Google aide les grandes entreprises à transformer leurs opérations et à devenir des leaders du numérique et de l'IA, ce qui constitue la nouvelle façon de passer au cloud », a proclamé Kurian.

À cette fin, Google a conçu de nombreux produits et services proposés via Google Cloud et les unités commerciales adjacentes.

IA générative de nouvelle génération

Kurian a déclaré que les plus grandes annonces de la Chocolaterie concernaient l'IA générative. « Les clients ont rapidement abandonné l'expérimentation de l'IA générative, l'aidant à répondre à des questions, à faire des prédictions en matière d'IA, et créent désormais des agents d'IA générative », a-t-il expliqué. « Les agents sont des entités intelligentes qui agissent pour vous aider à atteindre des objectifs spécifiques. »

À titre d'exemple, il a cité un scénario dans lequel un agent aide un acheteur en ligne à trouver la robe qu'il désire. Cette possibilité a ensuite été démontrée sur scène lorsqu'un champ de recherche d'achats en ligne a été alimenté par une URL de vidéo YouTube et une demande visant à trouver une chemise comme celle portée par le claviériste dans la vidéo. Effectivement, le robot IA s'est avéré capable de scanner la vidéo soumise, d'identifier la chemise du claviériste et de rechercher une correspondance dans l'inventaire du site commercial.

« Les agents traitent simultanément les informations multimodales, discutant, raisonnant, apprenant et prenant des décisions », a déclaré Kurian. "Les agents peuvent se connecter avec d'autres agents et avec des humains, et ils transformeront la façon dont chacun d'entre vous interagit avec les appareils informatiques et le Web lui-même."

Il restait à imaginer combien cela pourrait coûter à une entreprise pour fournir un tel service.

Le PDG de Goldman Sachs, David Sullivan, est apparu dans un témoignage vidéo pour souligner comment la société financière trouvait des utilisations pour l'IA. « Nous voyons déjà des signes de promesse dans quelques domaines de nos expérimentations, et nous sommes très optimistes à ce sujet », s'est-il enthousiasmé.

« Il est prouvé que les outils d'IA générative pour le codage assisté peuvent augmenter l'efficacité et la productivité des développeurs jusqu'à 40 % », a poursuivi Sullivan. "Et nous explorons différentes manières d'utiliser l'IA, qu'il s'agisse de résumer des documents publics, d'extraire des sentiments et des signaux à partir de déclarations d'entreprises, ou de recueillir et d'interpréter des informations telles que les rapports sur les résultats."

C’est une façon de dire que nous ne sommes pas encore sûrs de pouvoir nous fier pleinement aux conseils de l’IA.

Préparer le kit

En termes de produits et de services, Amin Vahdat, vice-président de l'équipe d'apprentissage automatique, de systèmes et d'IA cloud à Mountain View, a parlé du matériel de Google Cloud, y compris la disponibilité générale de Cloud TPU v5p, sans oublier les A3 Mega VM avec Nvidia H100. GPU Tensor Core.

Vahdat a également mentionné HyperDisk ML, un service de stockage en bloc en avant-première optimisé pour l'inférence d'IA et le traitement des charges de travail. « Il accélère les temps de chargement des modèles jusqu'à 11.9 fois par rapport aux alternatives courantes et offre un débit par volume plus de 100 fois supérieur à celui de ses concurrents », a-t-il déclaré.

De plus, Cloud Storage FUSE et Parallelstore de GCP disposent d'une nouvelle fonctionnalité de mise en cache censée accélérer la formation en stockant les données plus près du TPU ou du GPU d'un client.

Vahdat a également mis en avant des options logicielles ouvertes telles que JetStream, un moteur d'inférence optimisé qui offre de meilleures performances par dollar pour les grands modèles de langage. De plus, Google Cloud prévoit de proposer début 2025 les puces Grace Blackwell de Nvidia : HGX B200 et GB200 NVL72.

La plus grande nouvelle en termes de matériel est peut-être que Google Cloud dispose désormais d'un processeur basé sur ARM appelé Axion. Google affirme qu'il offre des performances 50 % supérieures et une efficacité énergétique 60 % supérieure à celles des instances de calcul comparables basées sur x86. Au-delà de cela, il existe désormais des machines virtuelles N4 et C4, ainsi que des machines C3 sans système d'exploitation.

Vertex AI, la plate-forme d'IA d'entreprise de Google, offre désormais l'accès à une plus grande variété de modèles, notamment Gemini 1.5 Pro en avant-première publique, les modèles de génération d'images de la famille Imagen 2.0 et le CodeGemma assistant logiciel.

Vérifier les faits

Google essaie également de rendre ses modèles moins enclins à inventer des choses.

« Parce que la précision des réponses est essentielle pour les services gen AI, nous étendons nos capacités de mise à la terre dans Vertex AI, y compris la possibilité de mettre directement à la terre les réponses avec la recherche Google, désormais en préversion publique. Les utilisateurs de Vertex AI ont désormais accès à des informations récentes et de haute qualité qui améliorent considérablement la précision des réponses du modèle", explique Vahdat dans un communiqué d'accompagnement. déclaration.

C'est vrai – Recherche Google, aimant pour le spam Web et le marketing d'affiliation [PDF], peut servir de vérification de la réalité pour les modèles d'IA sujets aux hallucinations. Quel temps pour vivre.

Google Workspace n'a pas été épargné par l'augmentation de l'IA. Une application Google Vids sera disponible dans la suite en juin pour permettre aux utilisateurs de créer des vidéos assistées par l'IA.

"Vids est votre assistant vidéo, d'écriture, de production et de montage, tout en un", explique Aparna Pappu, directrice générale et vice-présidente de Google Workspace, dans un explicateur. "Il peut générer un storyboard que vous pouvez facilement modifier, et après avoir choisi un style, il rassemble votre premier brouillon avec des scènes suggérées à partir de vidéos, d'images et de musique de fond."

Google Meet propose désormais la prise de notes IA en avant-première et, en juin, bénéficiera également d'une traduction par apprentissage automatique. Plus tard cette année, Google Chat devrait ajouter la traduction et le résumé de l'IA. Ceci est disponible via le nouveau module complémentaire AI Meetings and Messaging pour 10 $ par utilisateur et par mois.

Oh, et si vous voulez le module complémentaire AI Security, qui permet aux équipes informatiques d'analyser, de classer et de sauvegarder automatiquement les fichiers sensibles dans Google Drive, cela coûtera 10 $ supplémentaires par utilisateur et par mois.

"Nous sommes à un point d'inflexion où les entreprises passent de l'idée de la génération IA et de l'IA à la mise en œuvre des usines IA du futur", a déclaré Chirag Dekate, vice-président de Garter. Le registre. « Tout ce que font les entreprises et tous ceux qui participent à ces parcours de création de valeur seront enrichis par des gains de productivité grâce à l’IA. »

Dekate considère l'IA Hypercomputer, terme utilisé par Google pour désigner sa pile d'IA, comme un point de différenciation par rapport à ses concurrents. "Ici, la partie optimisée de la charge de travail est importante car certaines parties du flux de travail bénéficieront des TPU et d'autres des GPU et des CPU", a-t-il expliqué.

« L’hyperordinateur IA permet un accès optimisé aux performances aux capacités de calcul optimisées pour la charge de travail qui sont nécessaires pour alimenter les expériences cloud natives de l’IA. La différenciation de Google réside dans une innovation de plusieurs décennies dans le matériel d'IA spécialement conçu.

Plus haut dans la pile, Dekate voit la valeur de l'utilisation par Google de divers modèles locaux et tiers, de sa plate-forme Vertex AI et de sa fondation AI Ready Data (Big Query, Looker et AlloyDB). 

« Donner vie à tout cela réside dans les principaux frameworks AI Agent », a déclaré Dekate. « Les agents IA sont vraiment importants dans la mesure où ils permettent aux entreprises d'ancrer tout ce qui précède dans la vérité d'entreprise et de donner vie à l'IA et à la génération IA dans les contextes de données et d'exécution d'entreprise. ®

spot_img

Dernières informations

spot_img