Logo Zéphyrnet

Nvidia dévoile un petit GPU pour station de travail économe en énergie

Date :

Nvidia a élargi son portefeuille de GPU lundi avec une toute petite carte de station de travail qui, selon elle, offre une amélioration considérable des performances tout en sirotant simplement de la puissance, relativement parlant.

Avec 2,816 16 cœurs CUDA et 6 Go de mémoire GDDRXNUMX ECC, le RTX 2000Ada Ce n'est peut-être pas la puce de poste de travail la plus puissante de Nvidia, mais son facteur de forme à double emplacement et mi-hauteur en fait l'un des plus petits basés sur la micro-architecture Ada Lovelace de Nvidia.

Ce n'est pas la première fois que nous voyons ce facteur de forme de Nvidia. Le RTX A12 de 2000 Go du GPU Slinger, qui a fait ses débuts en 2021, présentait une conception de style ventilateur similaire qui était capable de s'adapter à certains systèmes très petits, tels que celui de HP. Z2 G9 Mini.

Bien que l'actualisation Ada conserve le même budget d'alimentation de 70 W que son prédécesseur, Nvidia affirme que la nouvelle carte est environ 30 % plus rapide dans les charges de travail graphiques et jusqu'à 50 % plus rapide dans une variété de charges de travail de rendu et d'IA, comme le modèle de génération d'images à diffusion stable. .

En termes de performances brutes, Nvidia vante la carte comme étant capable de presser environ 12 téraFLOPS en simple précision ou environ 192 téraFLOPS de FP8 clairsemé à partir de sa puce GPU AD107.

Si cette matrice vous semble familière, c'est la même que celle utilisée dans les GPU de jeu Nvidia RTX 299 à 4060 $, que nous regardé Le printemps dernier. Il n'est pas rare que Nvidia (ou la plupart des fabricants de puces) recycle les puces pour les utiliser dans plusieurs familles de produits, en modifiant la configuration de la mémoire et/ou en activant/désactivant des fonctionnalités pour créer une différenciation. Par exemple, le L40 de Nvidia utilise le même matrice GPU comme le RTX 4090.

C'est une histoire similaire pour le RTX 2000 Ada, qui en plus d'être beaucoup plus petit que le RTX 4060, dispose de deux fois plus de mémoire et d'un TDP beaucoup plus faible, lui permettant de fonctionner entièrement depuis le slot PCIe. La RTX 2000 Ada a moins de cœurs CUDA et probablement des horloges inférieures, mais la carte n'est pas conçue pour le jeu.

Au lieu de cela, la gamme de stations de travail RTX de Nvidia – ce qu'elle appelait autrefois ses GPU Quadro – est certifiée pour une utilisation avec des charges de travail professionnelles, telles que Solidworks, et pourquoi elle arbore des éléments comme la mémoire ECC.

En parlant de mémoire, le tampon d'image plus grand du RTX 2000 Ada devrait également être pratique pour ceux qui augmentent leurs charges de travail de création ou de conception avec des modèles d'IA génératifs. Avec 16 Go de vRAM intégrée, la carte devrait facilement pouvoir accueillir 13 milliards de modèles de paramètres au FP8 et potentiellement encore plus en tirant parti de techniques telles que la quantification.

Cela dit, le bus mémoire de 128 bits de la carte pourrait s'avérer quelque peu limitant en termes de performances. Vous pouvez voir la fiche technique complète ici.

Mais si tout ce que vous recherchez est plus de mémoire pour exécuter localement de grands modèles de langage, il existe des options moins chères et/ou plus performantes, surtout si vous pouvez renoncer aux fonctionnalités de la station de travail de Nvidia. Les cartes graphiques RTX 4070 TI Super de Nvidia et RX 7600XT d'AMD, qui lancé au CES le mois dernier, disposent également de 16 Go de DRAM. Ce dernier peut être acheté pour 329 $, ce qui le rend considérablement moins cher que le RTX 2000 Ada à 625 $.

Si vous êtes à la recherche d'une petite carte de poste de travail avec un excès de vRAM, la RTX 2000 Ada est désormais disponible auprès de divers partenaires de cartes Nvidia, notamment Arrow Electronics, PNY et Ingram Micro. La carte sera également vendue sur les postes de travail pré-construits de HP, Dell Tech et Lenovo à partir d'avril. ®

spot_img

Dernières informations

spot_img