Zephyrnet-logo

Details over de AI-updates van Google voor de cloudinfrastructuur

Datum:

Cloud Volgende Google is tijdens Cloud Next dit jaar zeer gefocust op AI, met een hele reeks hardwareprojecten, waaronder TPU-updates, GPU-opties en een hele reeks softwaretools om het allemaal te laten werken.

Tijdens de eerste persoonlijke versie van het evenement sinds vóór de pandemie, gehouden in het enorme Moscone Center in San Francisco, liet Google details los over zijn Cloud TPU v5e, de nieuwste van zijn Tensor Processing Unit AI-versnellers, plus virtuele machine-instanties aangedreven door Nvidia H100 GPU's.

TPU's zijn het op maat gemaakte silicium van Google voor het versnellen van machinaal leren, en de Cloud TPU De service is gebaseerd op het eigen TensorFlow machine learning-framework van het bedrijf, naast andere frameworks, waaronder Jax en PyTorch.

De vorige AI-chip, TPU v4, werd officieel uitgebracht in 2021, hoewel de zoekgigant het al een aantal jaren eerder had getest.

Met Cloud TPU v5e beweert Google de trainingsprestaties per dollar en 2.5 keer de gevolgtrekkingsprestaties per dollar op grote taalmodellen (LLM's) en generatieve AI te hebben verdubbeld, vergeleken met Cloud-TPU v4.

De cloudgigant gebruikt TPUv4-engines om gevolgtrekkingen te maken voor zijn eigen zoekmachine en advertentieplatforms.

Google gaat acht verschillende virtuele machineconfiguraties aanbieden, variërend van één TPU-chip tot meer dan 250 binnen één slice.

Het gaat natuurlijk niet alleen om hardware. Ze richten zich op grotere schaalbaarheid voor het verwerken van grote AI-workloads in Cloud TPU v5e met een functie genaamd Multislice. Dit is momenteel in preview en is ontwikkeld om gebruikers in staat te stellen modellen buiten de grenzen van een enkele TPU-pod te schalen en, indien nodig, tienduizenden TPU-chips te omvatten. Trainingstaken waren voorheen beperkt tot een enkel stukje TPU-chips.

Ook gericht op veeleisende AI-workloads zoals LLM's zijn Google's A3 virtuele machine-instanties met acht Nvidia H100 GPU's, dubbele 4e generatie Intel Xeon schaalbare processors en 2 TB geheugen. Deze gevallen waren voor het eerst aangekondigd op Google IO in mei, maar zullen nu volgende maand beschikbaar zijn, zei het.

Met verbeteringen in de netwerkbandbreedte dankzij een offload-netwerkadapter en Nvidia Connective Communications Library (NCCL), verwacht Google dat de virtuele A3-machines een boost zullen geven aan gebruikers die steeds geavanceerdere AI-modellen willen bouwen.

Google Next leverde ook details op over GKE Enterprise, beschreven als een premiumversie van de beheerde versie van het bedrijf Google Kubernetes-engine (GKE)-service voor gecontaineriseerde workloads.

De GKE Enterprise-editie, die vanaf begin september als preview beschikbaar zal zijn, beschikt over een nieuwe multi-clustermogelijkheid waarmee klanten vergelijkbare workloads kunnen groeperen als ‘vloten’ en aangepaste configuraties en beleidsbeschermingen kunnen toepassen op de gehele vloot, aldus Google.

Deze editie wordt geleverd met beheerde beveiligingsfuncties, waaronder inzichten in kwetsbaarheden in de werkbelasting, beheer- en beleidscontroles, plus een beheerde servicemesh. Met mogelijkheden uit het Anthos-platform van Google beweert het bedrijf dat de GKE Enterprise-editie hybride en multi-cloudscenario's kan omvatten, zodat gebruikers containerworkloads kunnen uitvoeren op andere openbare clouds, zowel op locatie als op GKE.

Bovendien ondersteunt GKE nu zelf zowel Cloud TPU v5e als de A3 virtuele machine-instanties met H100 GPU's voor veeleisende AI-workloads, aldus Google.

Google zet ook het AI-thema voort en brengt er toevoegingen aan Gedistribueerde cloud van Google (GDC) aanbod, plus bijgewerkte hardware ter ondersteuning van de on-prem uitbreiding van het cloudplatform.

De drie nieuwe AI- en dataaanbiedingen zijn Vertex AI-integraties, AlloyDB Omni en Dataproc Spark. De Vertex-integraties brengen Vertex Prediction en Vertex Pipelines naar GDC Hosted, hoewel deze pas vanaf Q2 2024 als preview beschikbaar zullen zijn.

AlloyDB Omni is een nieuwe beheerde database-engine, waarvan wordt beweerd dat deze tweemaal de snelheid biedt van PostgreSQL voor transactionele workloads, en momenteel beschikbaar is als preview-versie.

Dataproc Spark is een beheerde service voor het uitvoeren van analytische workloads onder Apache Spark, waarvan wordt beweerd dat het gebruikers lagere kosten biedt dan het zelf implementeren van Spark. De game zal vanaf het vierde kwartaal als preview beschikbaar zijn.

Ten slotte zei Google dat het een bijgewerkte hardwarestack voor GDC introduceert, met 4e generatie Intel Xeon schaalbaar processors en netwerkstructuren met hogere prestaties met een doorvoersnelheid tot 400 Gbps. ®

spot_img

Laatste intelligentie

spot_img