شعار زيفيرنت

تقدم شريحة الذكاء الاصطناعي من الجيل التالي من Meta الإعلانات أثناء استهلاك الطاقة

التاريخ:

بعد إثارة الجيل الثاني من مسرع الذكاء الاصطناعي في فبراير، أصبحت شركة Meta جاهزة لكشف النقاب عن هذا السيليكون المحلي، والذي يقال إنه يعمل بالفعل على تشغيل توصيات الإعلانات في 16 منطقة.

لقد قام عملاق Facebook بتصميم مسرعات مخصصة لجميع أنواع أعباء العمل التي تتراوح من بث الفيديو إلى التعلم الآلي لدفع نماذج التوصية وراء إمبراطوريته الإعلانية.

أحدث إضافة إلى عائلة Meta Training Inference Accelerator (MTIA) تطالب بأداء أعلى بمقدار 3x وميزة كفاءة الطاقة بمقدار 1.5x مقارنة بالجزء الأول من الجيل الأول، وهو ما قاله أصدقاؤنا في The Next Platform حلل العام الماضي.

وفقًا لـ Meta، فإن شريحة الجيل الثاني، والتي سنسميها MTIA v2 من أجل الاتساق، تم تصميمها لتحقيق التوازن بين الحوسبة وسعة الذاكرة وعرض النطاق الترددي للحصول على أفضل أداء ممكن للتصنيف الداخلي ونماذج التوصية الخاصة بـ Hyperscaler .

وبالتعمق في التصميم، يتميز المسرع بشبكة 8 × 8 من عناصر المعالجة (PEs) التي توفر معًا أداء حوسبة عالي الكثافة بمقدار 3.5 مرة أو أداء أعلى بمقدار 7 مرات مع تمكين التناثر مقارنةً بـ MTIA v1.

تعمل مسرعات الذكاء الاصطناعي الخاصة بـ Meta بالفعل على تشغيل نماذج التصنيف والتوصية الخاصة بأجهزة Hyperscaler

يعمل أحدث مسرع الذكاء الاصطناعي من Meta، أعلاه، على تشغيل نماذج التصنيف والتوصية الخاصة بـ Hyperscaler - انقر للتكبير. المصدر: ميتا

بالإضافة إلى استخدام عقدة معالجة TSMC أصغر بحجم 5 نانومتر وزيادة سرعة الساعة من 800 ميجاهرتز إلى 1.35 جيجاهرتز، تشير Meta إلى العديد من التحسينات المعمارية والتصميمية التي ساهمت في مكاسب أداء الجزء الأخير. يتضمن ذلك دعمًا للحسابات المتفرقة، والمزيد من الذاكرة أثناء التشغيل والإيقاف، وشبكة مطورة على الرقاقة (NoC) مع ضعف عرض النطاق الترددي للنموذج القديم. وإليك كيفية مقارنة الجيل الأول والثاني:

  متيا v1 متيا v2
تكنولوجيا العمليات 7 نانومتر TSMC 5 نانومتر TSMC
منطقة يموت 373mm2 421mm2
PE's شبكة 8 × 8 شبكة 8 × 8
سرعة الساعة 800MHz 1.35GHz
أداء INT8 102 TOPS 354/708 * بلايز
أداء FP16/BF16 51.2 TFLOPS 177/354 * تفلوب
ذاكرة PE 128 كيلو بايت لكل PE 384 كيلو بايت لكل PE
ذاكرة على الرقاقة 128MB 256MB
ذاكرة خارج الرقاقة 64GB 128GB
ذاكرة خارج الرقاقة BW 176GB / ثانية 204GB / ثانية
الإتصال 8x PCIe Gen 4.0 – 16 جيجابايت/ثانية 8x PCIe Gen 5.0 – 32 جيجابايت/ثانية
TDP 25W 90W

* أداء متناثر. يمكنك العثور على تفاصيل كاملة لكلا الرقاقتين هنا.

تجدر الإشارة إلى أن الإصدار الثاني من MTIA لن يلغي حاجة عملاق الويب إلى وحدات معالجة الرسومات. سبق أن قال مارك زوكربيرج Metasupremo عن شركته الضخمة سوف تنشر 350,000 مسرع Nvidia H100 وسيكون لديها ما يعادل 600,000 H100 جاهزة للعمل بحلول نهاية العام.

بدلاً من ذلك، تتبع MTIA نمطًا مألوفًا بشكل متزايد لـ Meta (وغيرها) لتطوير السيليكون المخصص المصمم خصيصًا لمهام محددة. الفكرة هي أنه على الرغم من أن المجموعة قد لا تكون مرنة مثل وحدات المعالجة المركزية ووحدات معالجة الرسومات، إلا أن ASIC عند نشرها على نطاق واسع يمكن أن تكون أكثر كفاءة.

في حين أن أحدث شريحة تستهلك ما يقرب من أربعة أضعاف قوة سابقتها، فهي قادرة على إنتاج ما يصل إلى 7 أضعاف أداء النقطة العائمة. من خلال مقارنته بوحدة معالجة الرسومات، يدير أحدث مسرع من Meta 7.8 TOPS لكل واط (TOPS/W)، وهو ما ناقش في تغطية Blackwell الخاصة بنا، يتفوق على Nvidia's H100 SXM بمعدل 5.65 TOPS/W وأكثر من ضعف نظيره في A100 SXM بمعدل 3.12 TOPS/W.

بعد قولي هذا، من الواضح أن Meta قد بذلت جهودًا كبيرة لضبط حجم الشريحة وفقًا لأحمال العمل الداخلية الخاصة بها - أي الاستدلال على نماذج التوصية. وقد تم تصميمها لتقديم اقتراحات مخصصة مثل الأشخاص الذين قد تعرفهم، أو الأهم من ذلك بالنسبة لنموذج أعمال Meta، أي الإعلانات على الأرجح ذات صلة بك.

تم تصميم الرقائق أيضًا للتطوير حسب الحاجة ويمكن نشرها في نظام قائم على حامل يحتوي على 72 مسرعًا إجمالاً: يجمع كل نظام بين ثلاثة هياكل يحتوي كل منها على 12 لوحة حسابية مع شريحتي MTIA v2 لكل لوحة.

يحتوي كل هيكل MTIA v2 على 12 لوحة حسابية تحتوي كل منها على زوج من المسرعات

يحتوي كل هيكل MTIA v2 على 12 لوحة حسابية تحتوي كل منها على زوج من المسرعات... انقر للتكبير. المصدر: ميتا.

فيما يتعلق بنشر أحمال العمل، تعتمد Meta بشكل كبير على إطار عمل PyTorch ومترجم Triton. لقد رأينا هذا المزيج يستخدم لأداء المهام على وحدات معالجة الرسومات والمسرعات المختلفة، ويرجع ذلك جزئيًا إلى أنه يلغي إلى حد كبير الحاجة إلى تطوير تعليمات برمجية محسنة لأجهزة معينة.

ميتا، كان رئيسيا مؤيد PyTorch، والتي طورتها قبل تسليم زمام الأمور إلى Linux Foundation، لأنها تمنح المهندسين المرونة اللازمة لتطوير تطبيقات الذكاء الاصطناعي التي يمكن تشغيلها عبر مجموعة متنوعة من أجهزة GPU من Nvidia وAMD. لذا فمن المنطقي أن ترغب شركة Meta في استخدام نفس التقنيات مع شرائحها الخاصة.

في الواقع، تدعي Meta أنه من خلال التطوير المشترك لبرامجها وأجهزتها معًا، تمكنت من تحقيق كفاءة أكبر مقارنة بمنصات وحدات معالجة الرسومات الحالية وتتوقع تحقيق المزيد من الأداء من خلال التحسينات المستقبلية.

من المؤكد أن MTIA v2 لن يكون آخر السيليكون الذي نراه من Meta. يقول عملاق وسائل التواصل الاجتماعي إن لديه العديد من برامج تصميم الرقائق قيد التنفيذ، بما في ذلك البرنامج الذي سيدعم أنظمة الذكاء الاصطناعي التوليدية المستقبلية. ®

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة