<!–
->
Image : Mark Hachman / IDG
Étant donné qu'Intel ne prévoit pas de processeur de bureau doté de capacités d'IA avant la fin de cette année, les fabricants de PC se tournent plutôt vers les startups de puces – et l'avenir pourrait être dans le Lenovo ThinkCentre Neo Ultra, potentiellement avec des cartes AI de MemryX et Kinara à l'intérieur.
Lenovo lancera le ThinkCentre Neo Ultra en juin pour environ 1,000 2024 $, a déclaré le chef de produit Bryan Lin depuis le stand de Lenovo au CES XNUMX. Bien que la documentation de Lenovo n'inclut officiellement aucun des deux processeurs IA, c'est probable. Et le petit bureau de création de contenu était présent au CES et présentait les deux cartes IA.
Alors qu'AMD, Intel et Qualcomm ont tous présenté des processeurs mobiles avec des NPU AI intégrés, seulement AMD a annoncé un processeur Ryzen de bureau avec un APU à l'intérieur. Intel, qui détient une part dominante dans l'industrie des processeurs pour PC, devra attendre la lancement d'Arrow Lake pour mettre un NPU à la disposition des fabricants d'ordinateurs de bureau.
Pendant ce temps, de plus en plus de fabricants de PC se rendent compte qu’un « PC IA » peut en réalité être construit avec seulement un CPU et un GPU, tandis que les NPU fournissent une IA plus économe en énergie. Si vous êtes un fabricant d’ordinateurs de bureau et que vous vous souciez généralement moins de la consommation d’énergie, cela peut suffire. Mais les entreprises qui souhaitent appliquer l’IA pour gagner de l’argent veulent l’IA maintenant – et elles se soucient de minimiser la consommation d’énergie à grande échelle. Dans ce domaine au moins, le marché professionnel pourrait devancer les PC grand public.
Mark Hachman / IDG
"Ce que nous constatons maintenant, c'est que la carte graphique discrète est trop gourmande en termes de facteur de forme et de puissance, de conception thermique, et cetera", a déclaré Lin. "Ainsi, une carte NPU consommant environ 5 à 10 watts peut nous donner un certain niveau de capacités d'IA."
Mais qu’en est-il des débuts d’Arrow Lake ?
"Avec Arrow Lake, ce que je comprends, c'est que la puissance est encore très limitée [en termes de]", a déclaré Lin. « Donc, dans au moins dix-huit à vingt-quatre mois, je pense que les [accélérateurs d’IA] discrets en feront toujours partie. Et surtout pour les ordinateurs de bureau, où nous n’avons pas de limitation de batterie.
Mark Hachman / IDG
Le ThinkCentre Neo Ultra comprendra jusqu'à un processeur Intel Core i9 vPro d'une architecture non divulguée, avec jusqu'à 64 Go de mémoire DDR5-5200. Il comprendra également un GPU Nvidia GeForce RTX 4060 de classe créateur, jusqu'à 4 To de stockage SSD, avec une alimentation interne de 350 W. Il s’agit d’un châssis de 3.6 litres mesurant 7.67 x 7.67 x 4.21 pouces.
Lenovo dispose de ce qu'il appelle un moteur d'IA, acheminant les charges de travail là où elles s'adaptent le mieux, a déclaré Lin.
Mark Hachman / IDG
Lin a déclaré qu'il existe un certain nombre de startups de puces IA avec lesquelles la société travaille, notamment MemryX et Kinara, les deux sociétés de puces IA présentées sur le stand.
Rencontrez MemryX, l'un des premiers accélérateurs d'IA
MemryX fabrique l'accélérateur MX3 Edge AI. Le kit de développement logiciel de la société, et ce que Lenovo présente à l'intérieur du ThinkCentre, est composé de quatre puces MX3 montées sur une carte PCI Express M.2 (Gen3, de manière quelque peu surprenante), bien qu'il puisse également fonctionner dans une carte USB 3.2. .
MemryX évalue chaque MX3 comme capable de 10 TFLOP (trillions d'opérations à virgule flottante) au lieu des TOPS plus conventionnels – soit 40 TFLOPS par carte, avec 4 puces par carte. En effet, le MX3 utilise par défaut des opérations à virgule flottante de 16 bits et des poids de 8 bits, plutôt que les opérations entières qui sont une métrique plus courante, selon Roger Peene, vice-président du développement produit et commercial de MemryX.
"Lorsqu'il y aura une opportunité d'utiliser des solutions discrètes, tout le monde l'utilisera jusqu'à ce qu'Intel ou AMD les intègre", a déclaré Peene. « Donc tout le monde connaît le retard d’Intel… ils ont intensifié leur marketing. Ils ne sont clairement pas contents que Lenovo choisisse une startup pour exécuter l’IA sur un PC. C’est donc un peu l’histoire.
Mark Hachman / IDG
Chaque MX3 consomme en moyenne 1 à 2 watts, a déclaré Peene. Les puces prennent en charge Linux, Android et Windows, ainsi que les frameworks TensorFlow, TensorFlow-lite, PyTorch, ONNX et Keras.
Chaque puce peut exécuter un modèle avec 10 millions de paramètres 8 bits, mis à l'échelle si nécessaire. Prêt à l'emploi, le MX3 peut exécuter YOLO v7 tiny à 416 × 416, 375 ips (x2) sans élagage ni entraînement, ou SSDMobileNet (224 × 224) à 1403 XNUMX ips.
Nous n’avons pas eu l’occasion de parler à Kinara, même si la société lancé son processeur Ara-2 Edge AI l’automne dernier. "À titre d'exemple de ses capacités de traitement de modèles d'IA générative, Ara-2 peut atteindre 10 secondes par image pour une diffusion stable et des dizaines de jetons/s pour LLaMA-7B", a déclaré la société dans un communiqué de presse.
Mark Hachman / IDG
Les puces MemryX et Kinara AI se positionnent en premier comme IA pour la reconnaissance d'images, avec une démo MemryX montrant comment elle pourrait reconnaître si les ouvriers du bâtiment avaient enfilé le bon équipement de protection. Pourtant, l’IA peut être utilisée à toutes sortes de fins : jeux, avatars, modèles/chatbots en langue locale, et bien plus encore.
Ce qui est plus important, cependant, c’est que des sociétés comme Nvidia, Rendition, 3Dfx et d’autres se sont lancées il y a des années en tant qu’accélérateurs 3D – et maintenant, après que certaines aient été abandonnées, dominent l’industrie de la création de contenu et des jeux. Attendez-vous à une nouvelle vague de cartes accélératrices d’IA pour les défier.
Clarification : Le MemryX MX3 est capable de 10 TFLOPS par puce, soit 40 par carte.
Codes de coupon
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
- PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
- PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
- PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
- La source: https://www.pcworld.com/article/2196895/first-pc-ai-accelerator-cards-from-memryx-kinara-debut-at-ces.html