Zephyrnet-Logo

Meta stellt neue Generation von KI-Chips als Herausforderung für Nvidia – Tech Startups vor

Datum:

Meta Platforms hat den Vorhang für seinen neuesten Durchbruch gelüftet: die nächste Iteration seines hauseigenen Beschleunigerchips für künstliche Intelligenz. Meta enthüllte am Mittwoch Einzelheiten zur neuen Generation von KI-Chips, zwei Monate nachdem das Unternehmen dies bekannt gegeben hatte Entwicklung neuer benutzerdefinierter KI-Chips um seine KI-Initiativen voranzutreiben.

Laut Meta ist die kommende Generation seiner umfangreichen Infrastruktur sorgfältig entwickelt und basiert auf KI als Kernstück. Dieser strategische Schritt zielt darauf ab, die Unterstützung für neuartige generative KI-Produkte, ausgefeilte Empfehlungssysteme und hochmoderne KI-Forschung zu stärken. Es handelt sich um eine kalkulierte Investition, die parallel zu den steigenden Rechenanforderungen immer komplexerer KI-Modelle skaliert werden kann.

In einem aktuellen Blog-Beitrag erläuterte Meta: „Die Architektur dieses Chips ist im Wesentlichen darauf ausgerichtet, das richtige Gleichgewicht zwischen Rechenleistung, Speicherbandbreite und Speicherkapazität für die Bereitstellung von Ranking- und Empfehlungsmodellen bereitzustellen.“

Insbesondere hatte Meta bereits im vergangenen Jahr seinen Meta Training and Inference Accelerator (MTIA) v1 vorgestellt – einen bahnbrechenden KI-Inferenzbeschleuniger, der im eigenen Haus entwickelt wurde und sorgfältig auf die einzigartigen KI-Workloads von Meta zugeschnitten ist. MTIA v1 wurde speziell für Deep-Learning-Empfehlungsmodelle entwickelt und hat maßgeblich zur Verbesserung einer Vielzahl von Benutzererlebnissen in der Meta-Suite von Apps und Technologien beigetragen.

Meta fügte hinzu, dass die neueste Version von MTIA ein wesentlicher Bestandteil seines umfassenden Entwicklungsplans für maßgeschneidertes Silizium ist, das speziell für die Bewältigung unserer einzigartigen Aufgaben und Systeme entwickelt wurde.

„Diese neue Version von MTIA verdoppelt die Rechen- und Speicherbandbreite unserer vorherigen Lösung mehr als und behält gleichzeitig unsere enge Verbindung zu unseren Arbeitslasten bei. Es ist darauf ausgelegt, die Ranking- und Empfehlungsmodelle effizient zu bedienen, die den Benutzern qualitativ hochwertige Empfehlungen bieten“, sagte Meta in der Blog-Post.

Die Architektur des Chips legt Wert darauf, die richtige Balance zwischen Rechenleistung, Speicherbandbreite und Kapazität zu finden, die speziell auf Ranking- und Empfehlungsmodelle zugeschnitten ist.

Der soziale Riese sagte, er habe MTIA bereits in seinen Rechenzentren implementiert und führe dort aktiv Modelle in realen Szenarien aus. Frühes Feedback weist auf vielversprechende Ergebnisse hin, die es uns ermöglichen, mehr Rechenressourcen für unsere anspruchsvollen KI-Aufgaben bereitzustellen. Erste Tests zeigen, dass dieser MTIA-Chip sowohl einfache als auch komplexe Ranking- und Empfehlungsmodelle, entscheidende Komponenten der Meta-Produkte, effektiv verarbeitet. Dank unserer durchgängigen Kontrolle über das gesamte System erreichen wir eine höhere Effizienz im Vergleich zu GPUs von der Stange.

Inzwischen früher Berichte von Reuters deutete in diesem Jahr auf Metas Pläne hin, eine neue Version seines benutzerdefinierten Rechenzentrumschips auf den Markt zu bringen, um den steigenden Rechenanforderungen gerecht zu werden, die für den Betrieb KI-gesteuerter Produkte auf Facebook, Instagram und WhatsApp erforderlich sind. Dieser intern „Artemis“ genannte Chip soll Metas Abhängigkeit von Nvidias KI-Chips verringern und gleichzeitig den Gesamtenergieverbrauch senken.

Der Start hat Meta jedoch nicht davon abgehalten, Nvidia-Chips zu kaufen. Das Unternehmen investiert außerdem stark in den Kauf von Nvidia- und anderen KI-Chips. CEO Mark Zuckerberg gab dieses Jahr bekannt, dass Meta etwa 350,000 Flaggschiff-H100-Chips von Nvidia beziehen will. Zuckerberg erwähnte weiter, dass Meta in Kombination mit Chips anderer Anbieter bis Ende des Jahres den Gegenwert von 600,000 H100-Chips anhäufen will.


spot_img

Neueste Intelligenz

spot_img