Zephyrnet-logo

Coherent demonstreert optische schakelaars voor nog grotere AI-clusters

Datum:

Netwerkbiz Coherent onthulde maandag tijdens de Optical Fiber Communication Conference een optische circuitschakelaar die is ontworpen om AI-clusters met hoge dichtheid te ondersteunen.

De schakelaar is niet zoals die je normaal gesproken in AI-clusters aantreft, in die zin dat het daadwerkelijke schakelen volledig optisch wordt afgehandeld, in plaats van het gebruik van zendontvangers om fotonen in elektronen om te zetten en weer terug. Laserlicht komt eenvoudigweg de ene poort binnen en verlaat de andere – uiteraard met een beetje demping.

De toestel, dat volgend jaar in volume zal worden verzonden, beschikt over 300 invoer- en 300 uitvoerpoorten en is gebaseerd op Coherent's Datacenter Light Wave Cross Connect-technologie. Zoals wij het begrijpen, werkt het door vloeibare-kristalcellen te manipuleren om te bepalen welke golflengte van licht waar naartoe gaat.

Coherent's nieuwste optische circuitschakelaar, tentoongesteld op OFC, beschikt over 300 invoer- en 300 uitvoerpoorten.

Coherent's nieuwste optische circuitschakelaar, tentoongesteld op OFC, beschikt over 300 invoer- en 300 uitvoerpoorten – Klik om te vergroten

Dat vertelde Dell'Oro Group-analist Sameh Boujelbene Het register dat optische circuitschakelaars een aantal voordelen bieden. Naast netwerken met hoge bandbreedte en lage latentie zijn dit soort switches vaak goedkoper in gebruik, omdat ze aanzienlijk minder elektrische schakelaars en optische transceivers vereisen.

Bovendien merkt Coherent op dat dit soort optisch schakelen doorgaans betrouwbaarder is – iets dat zijn vruchten zal afwerpen in zeer grotere clusters, waar de gemiddelde tijd tot falen doorgaans vrij laag is.

Dit is een van de redenen dat Google zijn eigen optische circuitschakelaars heeft ontwikkeld voor zijn TPUv4-pods. Vorig jaar sprak Andy Swing, een technische leider van de TPU-groep van Google, op Hot Chips: uitgelegd [Video] dat Google door het gebruik van OCS zeer grote hoeveelheden versnellers aan elkaar kon schakelen.

Deze pods bestaan ​​uit 64 racks met elk 64 Tensor Processing Units (TPU’s). Elk van deze racks was optisch verbonden met een van de intern ontwikkelde OCS-switches van Google, voor een alles-to-all-mesh.

Swing legde uit dat deze aanpak een aantal voordelen heeft, waaronder de mogelijkheid om de clustergrootte dynamisch opnieuw te configureren. Een andere is dat alle versnellers met elkaar zijn verbonden, wat de betrouwbaarheid verbetert – een wenselijke kwaliteit omdat de trainingsbelasting maanden kan duren, afhankelijk van het aantal parameters van het model en de grootte van de dataset.

Als in het geval van de TPUv4-pods van Google een van de knooppunten uitvalt, kan de switch opnieuw worden geconfigureerd om het probleem te omzeilen.

Swing merkte ook op dat de aanpak het mogelijk maakt om verschillende netwerktopologieën te gebruiken, afhankelijk van het model. Tijdens het testen zag Google bijvoorbeeld een aanzienlijke toename van de netwerkbandbreedte door gebruik te maken van een gedraaide torustopologie, waarbij versnellers in elkaar zijn geweven in iets dat lijkt op een gedraaide lus.

Maar hoewel de nieuwe OCS-apparaten van Coherent anderen in staat kunnen stellen optisch geschakelde clusters te bouwen die vergelijkbaar zijn met die van Google, merkte Boujelbene van Dell Oro op dat OCS nog steeds een relatief nieuwe technologie is in het datacenter.

“Tot nu toe kon alleen Google het, na vele jaren in ontwikkeling, implementeren en masse in zijn datacenternetwerken”, zei ze. “Bovendien vereisen OCS-switches mogelijk een verandering in de geïnstalleerde glasvezelbasis, afhankelijk van de cloudserviceprovider.” ®

spot_img

Laatste intelligentie

spot_img