تقدم شريحة الذكاء الاصطناعي من الجيل التالي من Meta الإعلانات بينما تستهلك الطاقة

بعد إثارة الجيل الثاني من مسرع الذكاء الاصطناعي في فبراير، أصبحت شركة Meta جاهزة لكشف النقاب عن هذا السيليكون المحلي، والذي يقال إنه يعمل بالفعل على تشغيل توصيات الإعلانات في 16 منطقة.

لقد قام عملاق Facebook بتصميم مسرعات مخصصة لجميع أنواع أعباء العمل التي تتراوح من بث الفيديو إلى التعلم الآلي لدفع نماذج التوصية وراء إمبراطوريته الإعلانية.

• أحدث إضافة إلى عائلة Meta Training Inference Accelerator (MTIA) تطالب بأداء أعلى بمقدار 3x وميزة كفاءة الطاقة بمقدار 1.5x مقارنة بالجزء الأول من الجيل الأول، وهو ما قاله أصدقاؤنا في The Next Platform حلل العام الماضي.

وفقًا لـ Meta، فإن شريحة الجيل الثاني، والتي سنسميها MTIA v2 من أجل الاتساق، تم تصميمها لتحقيق التوازن بين الحوسبة وسعة الذاكرة وعرض النطاق الترددي للحصول على أفضل أداء ممكن للتصنيف الداخلي ونماذج التوصية الخاصة بـ Hyperscaler .

وبالتعمق في التصميم، يتميز المسرع بشبكة 8 × 8 من عناصر المعالجة (PEs) التي توفر معًا أداء حوسبة عالي الكثافة بمقدار 3.5 مرة أو أداء أعلى بمقدار 7 مرات مع تمكين التناثر مقارنةً بـ MTIA v1.

تعمل مسرعات الذكاء الاصطناعي الخاصة بـ Meta بالفعل على تشغيل نماذج التصنيف والتوصية الخاصة بأجهزة Hyperscaler

يعمل أحدث مسرع الذكاء الاصطناعي من Meta، أعلاه، على تشغيل نماذج التصنيف والتوصية الخاصة بـ Hyperscaler - انقر للتكبير. المصدر: ميتا

بالإضافة إلى استخدام عقدة معالجة TSMC أصغر بحجم 5 نانومتر وزيادة سرعة الساعة من 800 ميجاهرتز إلى 1.35 جيجاهرتز، تشير Meta إلى العديد من التحسينات المعمارية والتصميمية التي ساهمت في مكاسب أداء الجزء الأخير. يتضمن ذلك دعمًا للحسابات المتفرقة، والمزيد من الذاكرة أثناء التشغيل والإيقاف، وشبكة مطورة على الرقاقة (NoC) مع ضعف عرض النطاق الترددي للنموذج القديم. وإليك كيفية مقارنة الجيل الأول والثاني:

	متيا v1	متيا v2
تكنولوجيا العمليات	7 نانومتر TSMC	5 نانومتر TSMC
منطقة يموت	373mm²	421mm²
PE's	شبكة 8 × 8	شبكة 8 × 8
سرعة الساعة	800MHz	1.35GHz
أداء INT8	102 TOPS	354/708 * بلايز
أداء FP16/BF16	51.2 TFLOPS	177/354 * تفلوب
ذاكرة PE	128 كيلو بايت لكل PE	384 كيلو بايت لكل PE
ذاكرة على الرقاقة	128MB	256MB
ذاكرة خارج الرقاقة	64GB	128GB
ذاكرة خارج الرقاقة BW	176GB / ثانية	204GB / ثانية
الإتصال	8x PCIe Gen 4.0 – 16 جيجابايت/ثانية	8x PCIe Gen 5.0 – 32 جيجابايت/ثانية
TDP	25W	90W

* أداء متناثر. يمكنك العثور على تفاصيل كاملة لكلا الرقاقتين هنا.

تجدر الإشارة إلى أن الإصدار الثاني من MTIA لن يلغي حاجة عملاق الويب إلى وحدات معالجة الرسومات. سبق أن قال مارك زوكربيرج Metasupremo عن شركته الضخمة سوف تنشر 350,000 مسرع Nvidia H100 وسيكون لديها ما يعادل 600,000 H100 جاهزة للعمل بحلول نهاية العام.

بدلاً من ذلك، تتبع MTIA نمطًا مألوفًا بشكل متزايد لـ Meta (وغيرها) لتطوير السيليكون المخصص المصمم خصيصًا لمهام محددة. الفكرة هي أنه على الرغم من أن المجموعة قد لا تكون مرنة مثل وحدات المعالجة المركزية ووحدات معالجة الرسومات، إلا أن ASIC عند نشرها على نطاق واسع يمكن أن تكون أكثر كفاءة.

في حين أن أحدث شريحة تستهلك ما يقرب من أربعة أضعاف قوة سابقتها، فهي قادرة على إنتاج ما يصل إلى 7 أضعاف أداء النقطة العائمة. من خلال مقارنته بوحدة معالجة الرسومات، يدير أحدث مسرع من Meta 7.8 TOPS لكل واط (TOPS/W)، وهو ما ناقش في تغطية Blackwell الخاصة بنا، يتفوق على Nvidia's H100 SXM بمعدل 5.65 TOPS/W وأكثر من ضعف نظيره في A100 SXM بمعدل 3.12 TOPS/W.

بعد قولي هذا، من الواضح أن Meta قد بذلت جهودًا كبيرة لضبط حجم الشريحة وفقًا لأحمال العمل الداخلية الخاصة بها - أي الاستدلال على نماذج التوصية. وقد تم تصميمها لتقديم اقتراحات مخصصة مثل الأشخاص الذين قد تعرفهم، أو الأهم من ذلك بالنسبة لنموذج أعمال Meta، أي الإعلانات على الأرجح ذات صلة بك.

تم تصميم الرقائق أيضًا للتطوير حسب الحاجة ويمكن نشرها في نظام قائم على حامل يحتوي على 72 مسرعًا إجمالاً: يجمع كل نظام بين ثلاثة هياكل يحتوي كل منها على 12 لوحة حسابية مع شريحتي MTIA v2 لكل لوحة.

يحتوي كل هيكل MTIA v2 على 12 لوحة حسابية تحتوي كل منها على زوج من المسرعات... انقر للتكبير. المصدر: ميتا.

فيما يتعلق بنشر أحمال العمل، تعتمد Meta بشكل كبير على إطار عمل PyTorch ومترجم Triton. لقد رأينا هذا المزيج يستخدم لأداء المهام على وحدات معالجة الرسومات والمسرعات المختلفة، ويرجع ذلك جزئيًا إلى أنه يلغي إلى حد كبير الحاجة إلى تطوير تعليمات برمجية محسنة لأجهزة معينة.

ميتا، كان رئيسيا مؤيد PyTorch، والتي طورتها قبل تسليم زمام الأمور إلى Linux Foundation، لأنها تمنح المهندسين المرونة اللازمة لتطوير تطبيقات الذكاء الاصطناعي التي يمكن تشغيلها عبر مجموعة متنوعة من أجهزة GPU من Nvidia وAMD. لذا فمن المنطقي أن ترغب شركة Meta في استخدام نفس التقنيات مع شرائحها الخاصة.

في الواقع، تدعي Meta أنه من خلال التطوير المشترك لبرامجها وأجهزتها معًا، تمكنت من تحقيق كفاءة أكبر مقارنة بمنصات وحدات معالجة الرسومات الحالية وتتوقع تحقيق المزيد من الأداء من خلال التحسينات المستقبلية.

من المؤكد أن MTIA v2 لن يكون آخر السيليكون الذي نراه من Meta. يقول عملاق وسائل التواصل الاجتماعي إن لديه العديد من برامج تصميم الرقائق قيد التنفيذ، بما في ذلك البرنامج الذي سيدعم أنظمة الذكاء الاصطناعي التوليدية المستقبلية. ®

محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
المصدر https://go.theregister.com/feed/www.theregister.com/2024/04/10/meta_mtia_chip/

ذكاء البيانات التوليدية

تقدم شريحة الذكاء الاصطناعي من الجيل التالي من Meta الإعلانات أثناء استهلاك الطاقة

يصل رمز Bitcoin Runecoin إلى أعلى سعر على الإطلاق قبل إدراج OKX - فك التشفير

تتجاوز رسوم معاملات الإيثريوم عملة البيتكوين مع تراجع المضاربات على الأحرف الرونية

أحدث المعلومات الاستخباراتية

تستعد هونج كونج لأول ظهور قياسي لصناديق الاستثمار المتداولة للعملات المشفرة حيث يتوقع المصدرون تدفقًا يتراوح بين 200 إلى 300 مليون دولار

كيفية استخدام الحقائب المخصصة في المملكة المتحدة لتحويل عملك

تستثمر شركة Tether 200 مليون دولار للوصول إلى الهدف "النهائي" المتمثل في وضع أجهزة الكمبيوتر في أدمغة الناس

تستثمر شركة Tether 200 مليون دولار للوصول إلى الهدف "النهائي" المتمثل في وضع أجهزة الكمبيوتر في أدمغة الناس

تجاوز بروتوكول Lido Finance لتوقيع Ethereum مليون جهة مصادقة

تم فتح أكثر من 3 مليارات دولار من الرموز المميزة في مايو — إليك ما يجب مشاهدته – فك التشفير