Zephyrnet-logo

De chef van Google Cloud is erg enthousiast over dit AI-gedoe

Datum:

Cloud Volgende De cloudactiviteiten van Google behaalden afgelopen kwartaal een jaarlijkse run rate van $36 miljard, meer dan vijf keer zoveel als vijf jaar geleden, maakte Alphabet-CEO Sundar Pichai dinsdag bekend op de Google Cloud Next 2024-conferentie in Las Vegas.

Hoewel dat ongeveer een derde is van de jaarlijkse omzet die wordt gegenereerd door AWS en Microsoft Azure, is dit niet onbelangrijk.

“Ik wil slechts een paar redenen benadrukken waarom Google Cloud zoveel vooruitgang laat zien”, aldus Pichai. “Een daarvan is onze diepe investeringen in AI. We weten al een tijdje dat AI elke sector en elk bedrijf zal transformeren, inclusief de onze.”

AI-software, met zijn voorkeur voor dure GPU-infrastructuur, zal veel omzet genereren voor cloudserviceproviders. Dat is de reden dat Google en zijn cloudrivalen er niet over zullen zwijgen. Maar het is potentieel ook nuttig.

“Tegenwoordig kan Google AI in twee minuten 100,000 regels code scannen om bugs op te sporen en op te lossen”, verklaarde de zoekgigant in zijn inleidende video. Spoiler: er zitten nog steeds bugs in de software.

“Vandaag heeft AI een positieve invloed op levens en begrijpt het werk op de manier waarop jij het doet”, vervolgde de videostem, zonder melding te maken van de manieren waarop AI de zaken nog erger heeft gemaakt: verkeerde informatie, hallucinaties, gebruik van hulpbronnen zoals energie en water, het vastleggen van het intellectuele werk van anderen en het zonder toestemming opnieuw gebruiken voor winst, en vooroordelen, onder andere.

Maar dat is niet wat de leidinggevenden van Google wilden te praten over. Thomas Kurian, CEO van Google Cloud, kwam niet om AI te begraven, maar om het te prijzen.

“Vandaag gaan we ons concentreren op de manier waarop Google toonaangevende bedrijven helpt hun activiteiten te transformeren en digitale en AI-leiders te worden, wat de nieuwe manier naar de cloud is”, verkondigde Kurian.

Met dat doel voor ogen heeft Google veel producten en diensten ontwikkeld die het aanbiedt via Google Cloud en aangrenzende bedrijfseenheden.

Generatieve AI van de volgende generatie

Kurian zei dat de grootste aankondigingen van de Chocoladefabriek te maken hebben met generatieve AI. “Klanten zijn snel overgestapt van het experimenteren met generatieve AI, naar het helpen van vragen en het doen van AI-voorspellingen, en bouwen nu generatieve AI-agenten”, legt hij uit. “Agenten zijn intelligente entiteiten die actie ondernemen om u te helpen specifieke doelen te bereiken.”

Als voorbeeld noemde hij een scenario waarin een agent een online shopper helpt bij het vinden van een gewenste jurk. Die mogelijkheid werd vervolgens op het podium gedemonstreerd toen een zoekvak voor e-commerce winkelen werd gevoed met een YouTube-video-URL en een verzoek om een ​​shirt te vinden zoals gedragen door de toetsenist in de video. En ja hoor, de AI-bot bleek in staat de ingediende video te scannen, het shirt van de toetsenist te identificeren en in de inventaris van de winkelsite te zoeken naar een match.

“Agenten verwerken multimodale informatie tegelijkertijd, praten, redeneren, leren en nemen beslissingen”, zegt Kurian. “Agenten kunnen verbinding maken met andere agenten en met mensen, en ze zullen de manier waarop jullie allemaal omgaan met computerapparatuur en het internet zelf transformeren.”

Het werd aan de verbeelding overgelaten hoeveel het een bedrijf zou kosten om een ​​dergelijke dienst te verlenen.

David Sullivan, CEO van Goldman Sachs, verscheen in een videotestimonial om te benadrukken hoe het financiële bedrijf toepassingen voor AI vond. "We zien al veelbelovende tekenen op een aantal gebieden van onze experimenten, en daar zijn we erg optimistisch over", zegt hij enthousiast.

“Er zijn aanwijzingen dat generatieve AI-tools voor ondersteunde codering de efficiëntie en productiviteit van ontwikkelaars met maar liefst 40 procent kunnen verhogen”, vervolgde Sullivan. “En we onderzoeken verschillende manieren om AI te gebruiken, of het nu gaat om het samenvatten van openbare documenten, het extraheren van sentiment en signalen uit bedrijfsverklaringen, of het verzamelen en interpreteren van informatie zoals winstrapporten.”

Dat is een manier om te zeggen dat we er nog niet helemaal zeker van zijn dat we volledig kunnen vertrouwen op AI-advies.

De kit klaarmaken

Op het gebied van producten en diensten sprak Amin Vahdat, VP voor het machine learning, systemen en cloud AI-team in Mountain View, over de hardware van Google Cloud, inclusief de algemene beschikbaarheid van Cloud TPU v5p, om nog maar te zwijgen van A3 Mega VM's met Nvidia H100 Tensor Core GPU's.

Vahdat noemde ook HyperDisk ML, een preview-blokopslagservice die is geoptimaliseerd voor AI-inferentie en het bedienen van werklasten. “Het versnelt de laadtijden van modellen tot 11.9x vergeleken met gewone alternatieven en biedt een meer dan 100 keer grotere doorvoer per volume vergeleken met concurrenten”, zegt hij.

Bovendien hebben GCP's Cloud Storage FUSE en Parallelstore een nieuwe caching-functie gekregen die de training zou moeten versnellen door gegevens dichter bij de TPU of GPU van een klant op te slaan.

Vahdat benadrukte ook open software-opties zoals JetStream, een geoptimaliseerde inferentie-engine die betere prestaties per dollar biedt voor grote taalmodellen. Bovendien is Google Cloud van plan om begin 2025 de Grace Blackwell-chips van Nvidia aan te bieden: HGX B200 en de GB200 NVL72.

Misschien wel het grootste nieuws op hardwaregebied was dat Google Cloud nu een ARM-gebaseerde CPU heeft genaamd Axion. Google beweert dat het 50 procent betere prestaties en 60 procent betere energie-efficiëntie biedt dan vergelijkbare x86-gebaseerde rekeninstanties. Daarnaast zijn er nu N4- en C4-VM's en bare-metal C3-machines.

Vertex AI, het zakelijke AI-platform van Google, biedt nu toegang tot een grotere verscheidenheid aan modellen, waaronder Gemini 1.5 Pro in openbare preview, Imagen 2.0-modellen voor het genereren van afbeeldingen en de CodeGemma software-assistent.

Controleren van de feiten

Google probeert ook zijn modellen minder geneigd te maken om zomaar dingen te verzinnen.

“Omdat responsnauwkeurigheid van cruciaal belang is voor de generatie AI-services, breiden we onze basismogelijkheden in Vertex AI uit, inclusief de mogelijkheid om reacties direct te aarden met Google Search, nu in openbare preview. Vertex AI-gebruikers hebben nu toegang tot nieuwe, hoogwaardige informatie die de nauwkeurigheid van modelreacties aanzienlijk verbetert”, legt Vahdat uit in een begeleidend document. verklaring.

Dat klopt – Google Zoeken, magneet voor webspam en affiliate marketing [PDF], kan dienen als reality check voor AI-modellen die gevoelig zijn voor hallucinaties. Wat een tijd om te leven.

Google Workspace bleef niet gespaard van de AI-augmentatie. Er komt in juni een Google Vids-app naar de suite waarmee mensen AI-ondersteunde video's kunnen maken.

"Vids is je video-, schrijf-, productie- en montageassistent in één", legt Aparna Pappu, GM en VP van Google Workspace, uit een uitlegger. "Het kan een storyboard genereren dat je gemakkelijk kunt bewerken, en nadat je een stijl hebt gekozen, wordt je eerste concept samengesteld met voorgestelde scènes uit stockvideo's, afbeeldingen en achtergrondmuziek."

Google Meet heeft nu AI-notities als voorbeeld en krijgt in juni ook machine learning-vertaling. Later dit jaar zal Google Chat AI-vertaling en -samenvatting toevoegen. Dit is beschikbaar via de nieuwe add-on AI Meetings and Messaging voor $ 10 per gebruiker per maand.

Oh, en als je de AI Security-add-on wilt, waarmee IT-teams gevoelige bestanden in Google Drive kunnen scannen en automatisch classificeren en beveiligen, kost dat nog eens $ 10 per gebruiker per maand.

“We bevinden ons op een soort keerpunt waar bedrijven evolueren van ideeën over Gen AI en AI naar het implementeren van AI-fabrieken van de toekomst”, zegt Garter VP Chirag Dekate. Het register. “Alles wat bedrijven doen en iedereen die deel uitmaakt van deze waardecreatiereizen zal worden uitgebreid met AI-productiviteitsboosts.”

Dekate beschouwt de AI Hypercomputer, de term van Google voor zijn AI-stack, als een punt van differentiatie ten opzichte van de concurrentie. “Hier is het voor de werklast geoptimaliseerde deel belangrijk omdat delen van de workflow zullen profiteren van TPU’s en andere van GPU’s en CPU’s”, legt hij uit.

“De AI Hypercomputer maakt prestatie-geoptimaliseerde toegang mogelijk tot de voor de werklast geoptimaliseerde rekenmogelijkheden die nodig zijn om AI-native cloud-ervaringen mogelijk te maken. De differentiatie van Google hier is een decennialange innovatie in speciaal ontworpen AI-hardware.”

Verderop in de stapel ziet Dekate waarde in het gebruik door Google van verschillende modellen van eigen bodem en van derden, het Vertex AI-platform en de AI Ready Data-basis (Big Query, Looker en AlloyDB). 

“Het allemaal tot leven brengen is de kern van het AI Agent-framework”, zegt Dekate. “De AI-agenten zijn erg belangrijk omdat ze bedrijven in staat stellen al het bovenstaande te baseren op de bedrijfswaarheid en AI en Gen AI tot leven te brengen in bedrijfsgegevens en uitvoeringscontexten.” ®

spot_img

Laatste intelligentie

spot_img