Zephyrnet-Logo

Nvidia stellt kleine, stromfressende Workstation-GPU vor

Datum:

Nvidia hat sein GPU-Portfolio am Montag um eine klitzekleine Workstation-Karte erweitert, von der sie behauptet, dass sie eine beträchtliche Leistungssteigerung liefert, während sie relativ gesehen nur an Strom mangelt.

Mit 2,816 CUDA-Kernen und 16 GB GDDR6 ECC-Speicher ist der RTX 2000 Ada Es ist vielleicht nicht der leistungsstärkste Workstation-Chip von Nvidia, aber sein Dual-Slot-Formfaktor mit halber Höhe macht ihn zu einem der kleinsten, der auf Nvidias Ada Lovelace-Mikroarchitektur basiert.

Dies ist nicht das erste Mal, dass wir diesen Formfaktor von Nvidia sehen. Der 12-GB-RTX A2000 des GPU-Slingers, der 2021 auf den Markt kam, verfügte über ein ähnliches Design im Gebläsestil, das in einige sehr kleine Systeme wie HP passte Z2 G9 Mini.

Während die Ada-Aktualisierung das gleiche Leistungsbudget von 70 W wie ihr Vorgänger beibehält, gibt Nvidia an, dass die neue Karte bei Grafik-Workloads etwa 30 Prozent schneller und bei einer Vielzahl von Rendering- und KI-Workloads, wie dem Stable Diffusion-Bilderzeugungsmodell, bis zu 50 Prozent schneller ist .

In Bezug auf die reine Leistung wirbt Nvidia damit, dass die Karte etwa 12 TeraFLOPS bei einfacher Präzision oder etwa 192 TeraFLOPS bei spärlichem FP8 aus ihrem AD107-GPU-Chip herausholen kann.

Wenn Ihnen dieser Chip bekannt vorkommt: Es ist derselbe, der in den Nvidia RTX 299-Gaming-GPUs für 4060 US-Dollar verwendet wird, die wir sah letzten Frühling. Es ist nicht ungewöhnlich, dass Nvidia (oder die meisten Chiphersteller) Chips zur Verwendung in mehreren Produktfamilien recycelt, die Speicherkonfiguration ändert und/oder Funktionen aktiviert/deaktiviert, um eine Differenzierung zu schaffen. Beispielsweise nutzt Nvidias L40 das Gleicher GPU-Chip wie die RTX 4090.

Ähnlich verhält es sich mit der RTX 2000 Ada, die nicht nur viel kleiner als die RTX 4060 ist, sondern auch über doppelt so viel Speicher und eine viel geringere TDP verfügt, sodass sie vollständig über den PCIe-Steckplatz betrieben werden kann. Die RTX 2000 Ada verfügt zwar über weniger CUDA-Kerne und vermutlich niedrigere Taktraten, allerdings ist die Karte nicht für Spiele konzipiert.

Stattdessen ist die RTX-Workstation-Reihe von Nvidia – wie das Unternehmen früher seine Quadro-GPUs nannte – für die Verwendung mit professionellen Workloads wie Solidworks zertifiziert und verfügt über Funktionen wie ECC-Speicher.

Apropos Speicher: Der größere Bildpuffer der RTX 2000 Ada dürfte auch für diejenigen praktisch sein, die ihre kreativen oder gestalterischen Arbeitslasten mit generativen KI-Modellen erweitern. Mit 16 GB integriertem vRAM sollte die Karte problemlos in der Lage sein, 13 Milliarden Parametermodelle bei FP8 und möglicherweise sogar noch größere Modelle unterzubringen, wenn Techniken wie Quantisierung genutzt werden.

Allerdings könnte sich der 128-Bit-Speicherbus der Karte hinsichtlich der Leistung als etwas einschränkend erweisen. Sie können das vollständige Datenblatt einsehen hier.

Wenn Sie jedoch nur mehr Speicher für die lokale Ausführung großer Sprachmodelle benötigen, gibt es günstigere und/oder leistungsfähigere Optionen, insbesondere wenn Sie auf die Workstation-Funktionen von Nvidia verzichten können. Nvidias RTX 4070 TI Super und AMDs RX 7600XT Grafikkarten, die ins Leben gerufen die letzten Monat auf der CES gezeigt wurden, verfügen außerdem über 16 GB DRAM. Letztere ist für 329 US-Dollar zu haben und damit deutlich günstiger als die RTX 2000 Ada mit 625 US-Dollar.

Wenn Sie auf der Suche nach einer kleinen Workstation-Karte mit viel vRAM sind, dann ist die RTX 2000 Ada ab sofort bei verschiedenen Nvidia-Board-Partnern erhältlich, darunter Arrow Electronics, PNY und Ingram Micro. Ab April wird die Karte auch in vorgefertigten Workstations von HP, Dell Tech und Lenovo verkauft. ®

spot_img

VC-Café

VC-Café

Neueste Intelligenz

spot_img