Zephyrnet-logo

DoE tar levering av Intels nyeste hjerne i en boks

Dato:

Intel Labs avslørte onsdag sin største nevromorfe datamaskin, et 1.15 milliarder nevronsystem, som det sier er omtrent analogt med en ugles hjerne.

Men ikke bekymre deg, Intel har ikke gjenskapt Fallouts Robobrain. I stedet for et nettverk av organiske nevroner og synapser, emulerer Intels Hala Point dem alle i silisium.

Med omtrent 20 W er hjernen vår overraskende effektiv til å behandle de store mengdene informasjon som strømmer inn fra hver av sansene til enhver tid. Feltet nevromorfikk, som Intel og IBM har brukt de siste årene på å utforske, har som mål å etterligne hjernens nettverk av nevroner og synapser for å bygge datamaskiner som er i stand til å behandle informasjon mer effektivt enn tradisjonelle akseleratorer.

Hvor effektiv? Ifølge Intel kan dets nyeste system, en 6U-boks omtrent på størrelse med en mikrobølgeovn som bruker 2,600 W, etter sigende oppnå dype nevrale nettverkseffektiviteter så høye som 15 TOPS/W med 8-bits presisjon. For å sette det i perspektiv, Nvidias kraftigste system, den Blackwell-baserte GB200 NVL72, som ennå ikke er sendt, forvalter bare 6 TOPS/W på INT8, mens de nåværende DGX H100-systemene kan klare omtrent 3.1 TOPS/W.

Forskere ved Sandia National Labs tar imot Intels 1.15 milliarder nevron Hala Point nevromorfe datamaskin

Forskere ved Sandia National Labs tar imot Intels 1.15 milliarder nevron Hala Point nevromorfe datamaskin – klikk for å forstørre

Denne ytelsen oppnås ved å bruke 1,152 2 av Intels Loihi 1.15-prosessorer, som er sydd sammen i et tredimensjonalt rutenett for totalt 128 milliarder nevroner, 140,544 milliarder synapser, 2,300 86 prosesseringskjerner og XNUMX innebygde xXNUMX-kjerner som håndterer de nødvendige beregningene fortsett med saken.

For å være klar, dette er ikke typiske x86-kjerner. "De er veldig, veldig enkle, små x86-kjerner. De er ikke noe som de siste kjernene våre eller Atom-prosessorene våre, sa Mike Davies, direktør for nevromorfisk databehandling i Intel, Registeret.

Hvis Loihi 2 ringer en bjelle, er det fordi brikken har vært det banker rundt for en stund nå etter å ha debutert tilbake i 2021 som en av de første brikkene produsert ved hjelp av Intels 7nm prosessteknologi.

Til tross for sin alder, sier Intel at de Loihi-baserte systemene er i stand til å løse visse AI-slutninger og optimaliseringsproblemer så mye som 50 ganger raskere enn konvensjonelle CPU- og GPU-arkitekturer, samtidig som de bruker 100 ganger mindre strøm. De tallene ser ut til å ha vært det oppnådd [PDF] ved å sette en enkelt Loihi 2-brikke til Nvidias lille Jetson Orin Nano og en Core i9 i9-7920X CPU.

Ikke kast ut GPU-ene dine ennå

Selv om det kan høres imponerende ut, innrømmer Davies at dens nevromorfe akseleratorer ikke er klare til å erstatte GPUer for hver arbeidsbelastning ennå. "Dette er ikke en generell AI-akselerator på noen måte," sa han.

For det første, uten tvil AIs mest populære applikasjon, de store språkmodellene (LLM) som driver apper som ChatGPT, vil ikke kjøre på Hala Point, i hvert fall ikke ennå.

"Vi kartlegger ikke noen LLM til Hala Point på dette tidspunktet. Vi vet ikke hvordan vi skal gjøre det. Helt ærlig, det nevromorfe forskningsfeltet har ikke en nevromorf versjon av transformatoren," sa Davies og la merke til at det er noe interessant forskning på hvordan det kan oppnås.

Når det er sagt, har Davies' team hatt suksess med å kjøre tradisjonelle dype nevrale nettverk, en flerlags perceptron, på Hala Point med noen forbehold.

"Hvis du kan sparsifisere nettverksaktiviteten og konduktiviteten i det nettverket, er det da du kan oppnå virkelig, virkelig store gevinster," sa han. "Det betyr at det må behandle et kontinuerlig inngangssignal ... en videostrøm eller en lydstrøm, noe der det er en viss korrelasjon fra prøve til prøve til prøve."

Intel Labs demonstrerte Loihi 2s potensial for video- og lydbehandling i en artikkel publisert [PDF] sent i fjor. I testing fant de at brikken oppnådde betydelige gevinster i energieffektivitet, latens og gjennomstrømning for signalbehandling, noen ganger over tre størrelsesordener, sammenlignet med konvensjonelle arkitekturer. De største gevinstene kom imidlertid på bekostning av lavere nøyaktighet.

Evnen til å behandle sanntidsdata med lav effekt og ventetid har gjort teknologien attraktiv for applikasjoner som autonome kjøretøy, droner og robotikk.

Et annet bruksområde som har vist seg å være lovende, er kombinatoriske optimaliseringsproblemer, som ruteplanlegging for et leveringskjøretøy, som må navigere i et travelt sentrum.

Disse arbeidsbelastningene er utrolig kompliserte å løse, ettersom små endringer som kjøretøyhastighet, ulykker og stenging av kjørefelt må tas i betraktning umiddelbart. Konvensjonelle databehandlingsarkitekturer er ikke godt egnet for denne typen eksponentiell kompleksitet, og det er grunnen til at vi har sett så mange leverandører av kvantedatabehandling rettet mot optimaliseringsproblemer.

Davies hevder imidlertid at Intels nevromorfe dataplattform er "langt mer moden enn disse andre eksperimentelle forskningsalternativene."

Plass til å vokse

Ifølge Davies er det også fortsatt god takhøyde som kan låses opp. "Jeg er trist å si at den ikke er utnyttet fullt ut til i dag på grunn av programvarebegrensninger," sa han om Loihi 2-brikkene.

Å identifisere maskinvareflaskehalser og programvareoptimalisering er en del av grunnen til at Intel Labs har distribuert prototypen hos Sandia.

"Å forstå begrensningene, spesielt på maskinvarenivå, er en veldig viktig del av å få disse systemene ut der," sa Davies. "Vi kan fikse maskinvareproblemene, vi kan forbedre det, men vi må vite hvilken retning vi skal optimalisere."

Dette ville ikke være første gang Sandia-boffins har fått tak i Intels nevromorfe teknologi. I et papir publisert tidlig i 2022 fant forskere ut at teknologien hadde potensial for HPC og AI. Disse eksperimentene brukte imidlertid Intels første generasjons Loihi-brikker, som har omtrent en åttendedel av nevronene (128,000 1 mot XNUMX million) av etterfølgeren. ®

spot_img

Siste etterretning

spot_img