شعار زيفيرنت

الكمبيوتر الفائق Dojo من Tesla يكسر جميع معايير الصناعة المعمول بها - CleanTechnica Deep Dive ، الجزء 2

التاريخ:

إذا فاتتك ، اقرأ أولاً: الكمبيوتر الفائق Dojo من Tesla يكسر جميع معايير الصناعة المعمول بها - CleanTechnica Deep Dive ، الجزء 1.

تسلا تكسر القواعد

ما تخطط Tesla للقيام به ببلاط Dojo التدريبي هو ربط معيار الصناعة بالكامل لتقطيع الرقاقة إلى قطع. إنه مجرد ترك 25 SoCs على الرقاقة واستخدام السيليكون عالي الجودة باهظ الثمن للسماح للرقائق بالتواصل مع بعضها البعض دون أي خسارة في السرعة بسبب الكابلات الضخمة الضخمة أو حتى السيليكون الأقل جودة للوحة الأم. على حد علمي ، هذا غير مسبوق تمامًا.

ومع ذلك ، فإن التحدي الأكبر الذي يواجه Tesla هو التأكد من أن الرقاقة تحتوي على قسم 5 × 5 مع عمل كل SoC بشكل لا تشوبه شائبة من أجل جعل النظام يعمل بالطريقة التي يتوقعونها. بالنظر إلى شكل البلاط التدريبي ذي الحواف المستديرة ، فمن المحتمل جدًا أن يمثل هذا الرقاقة بأكملها وأن الأمر برمته يحتاج إلى العمل بلا عيب - الرقاقة الفارغة لها لون رمادي غامق ، بعد كل شيء.

ومع ذلك ، بالنسبة لشركة تسلا ، قد يكون عائد الويفر مشكلة. على الرغم من أنه لا يحتاج إلا إلى 120 رقاقة كاملة الوظائف لـ Dojo ، يجب أن يكون قادرًا على إزالتها. على سبيل المقارنة ، أنتجت إنتل في عام 2014 أكثر من 130,000 ألف رقاقة ، ونحن نتحدث عن رقائق كبيرة بحجم 300 مم ، وليست تلك الأصغر حجمًا التي تستخدمها تسلا. أيضًا ، نظرًا لأن الرقاقة الأصغر لا يتم ملؤها حتى أسنانها كما لو كانت الرقاقة العادية ، يجب أن تكون التكاليف أقل بكثير. على الرغم من أن السيليكون عالي الجودة المصنوع منه الرقاقة ليس رخيصًا بشكل عام.


لا توجد ذاكرة وصول عشوائي ، لا ذاكرة تخزين مؤقت مشتركة

ما هو أيضًا غير مسبوق (على حد علمي) هو جهاز كمبيوتر لا يحتوي على أي ذاكرة وصول عشوائي خارج شركة نفط الجنوب. حتى الهاتف الذكي و HW3 من Tesla بهما شرائح RAM خارج شركة نفط الجنوب. حتى أسرع محركات الأقراص الثابتة الجديدة (التي سنصل إليها قليلاً) لا يمكنها ذلك Rوذكاء Access Memory بسرعة ذاكرة الوصول العشوائي ولا يمكن استبداله. نظريًا ، ستصل أحدث تقنيات PCIe-4 المتوفرة في السوق إلى 0.5-3 جيجابايت / ثانية فقط بدلاً من 20-25 جيجابايت / ثانية القياسية لأجهزة الكمبيوتر الاستهلاكية المزودة بذاكرة وصول عشوائي DDR4 ، أو حتى تصل إلى 50 جيجابايت / ثانية في اليوم التالي توليد ذاكرة الوصول العشوائي DDR5 التي بدأت في الظهور في مراكز البيانات. عندما يتعلق الأمر بالحجم ، عادةً ما تستخدم الهواتف الذكية وأجهزة الكمبيوتر الاستهلاكية 4-32 جيجابايت من ذاكرة الوصول العشوائي ويمكن أن تصل محطات العمل الاحترافية إلى 512 جيجابايت من ذاكرة الوصول العشوائي.

إذن ، إذا كان بلاط التدريب في Tesla لا يحتوي على ذاكرة وصول عشوائي ، فما الذي يعطي؟ حسنًا ، هناك فئة أسرع من الذاكرة العشوائية وتسمى ذاكرة التخزين المؤقت. هذا شيء غطيته أيضًا في المرة الأخيرة ولكنني سأفصله مرة أخرى. DRAM ، أو كما يسميها معظم الناس RAM ، عندما تستدعيها SoC / CPU ، يكون لها وقت استجابة يبلغ حوالي 60 نانوثانية. في حين أن ذاكرة التخزين المؤقت L3 أو ذاكرة SRAM على الرقاقة يمكن أن يكون لها وقت استجابة منخفض يصل إلى 10 نانوثانية. أكبر ذاكرة تخزين مؤقت L3 Intel لديها الآن 57 ميجابايت ، وسجل IBM هو 120 ميجابايت ، وأقوى معالجات AMD بها 256 ميجابايت من ذاكرة التخزين المؤقت L3 ، وشريحة HW3 من Tesla التي تم الإعلان عنها مرة أخرى في عام 2019 بها 64 ميجابايت من SRAM. 

ثم ، أخيرًا ، تحتوي عقدة التدريب الجديدة من Tesla على 1.25 ميغابايت من ذاكرة SRAM عالية السرعة. انتظر ماذا؟ هذا يبدو خطأ. حسنًا ، هذا لأننا نتحدث عن العقد ، وتشكل 354 عقدة مصفوفة حسابية. هذا يعني أن SoC لديها 424.8 ميجابايت من ذاكرة التخزين المؤقت ، متغلبًا على كل الآخرين. ومع ذلك ، لا أعتقد أن المتعة تنتهي عند هذا الحد ، مع الأخذ في الاعتبار حقيقة أن SRAM يقع مباشرة على كل عقدة وأن Tesla أطلق عليها اسم SRAM "عالي السرعة" ، وأظن أنه بدلاً من ذاكرة التخزين المؤقت L3 ، نحن نتحدث عن ذاكرة التخزين المؤقت L2 الأسرع ، على الرغم من وجود ذاكرة تخزين مؤقت L3 غير مشتركة بالطريقة التي تستخدمها شركة IBM ، فهي أيضًا احتمالية (ولكن أقل احتمالًا نظرًا لأن حجم ذاكرة التخزين المؤقت هذه يبلغ 10 ميجابايت ، ودوري مختلف ، ولدى Intel 1 ميجابايت من ذاكرة التخزين المؤقت L2 لكل جوهر).

بالنظر إلى حجم ذاكرة التخزين المؤقت 1.25 ميغابايت لكل عقدة ، سأكون على استعداد للمراهنة على أن هذه ذاكرة تخزين مؤقت L2. أحد الاختلافات الرئيسية بين ذاكرة التخزين المؤقت L1 و L2 مقابل ذاكرة التخزين المؤقت L3 (إلى جانب سرعتها وحجمها ، وهو ما سنصل إليه بعد قليل) هو أن ذاكرة التخزين المؤقت L1 & L2 توجد عادةً مباشرة على كل عقدة / مركز ، بينما L3 عادة (باستثناء شركة IBM) موجودة في مكان آخر على الشريحة ويتم مشاركتها من قبل جميع النوى / العقد.

لذا ، إذا كانت سعة 1.25 ميجابايت عبارة عن ذاكرة تخزين مؤقت L2 ، فسيضعها هذا في مقدمة شريحة Intel التي ذكرناها سابقًا. على الرغم من أن ذاكرة التخزين المؤقت Intel L3 كانت 57 ميجابايت ، إلا أنها تحتوي على 1 ميجابايت فقط من ذاكرة التخزين المؤقت L2 لكل نواة. ومع ذلك ، نظرًا لأن عدد نواة Intel البالغ 38 أقل بكثير من عدد عقدة Tesla البالغ 354 ، بشكل عام ، فإن مقدار ذاكرة التخزين المؤقت على معالج Intel أقل بكثير. نظرًا لأنني فشلت في ذكر ذلك حتى الآن ، فإن ذاكرة التخزين المؤقت L1 لها وقت استجابة 0.5 نانوثانية ، وذاكرة التخزين المؤقت L2 لها وقت استجابة من 3 إلى 4 نانوثانية ، وكما ذكرنا سابقًا ، فإن ذاكرة التخزين المؤقت L3 لها وقت استجابة يبلغ 10 نانوثانية ، و DRAM لديه وقت استجابة 60 نانوثانية.

بعد ذلك ، كما ترى ، هناك شيء يسمى Tesla إما ذاكرة تخزين مؤقت واحدة أو ذاكرة تخزين مؤقت أو ذاكرة تخزين مؤقت صغيرة للحرف L. أراهن أن هذا هو أسرع ذاكرة تخزين مؤقت من المستوى L1 ، وبشكل أكثر تحديدًا ذاكرة التخزين المؤقت لتعليمات L1. تحتوي معظم المعالجات على 1 ذاكرة تخزين مؤقت L2 ، واحدة للتعليمات وواحدة للبيانات - على الرغم من ذلك ، في الماضي ، كانت هذه ذاكرة تخزين مؤقت واحدة تم استخدامها لكليهما. على أي حال ، بافتراض أن Tesla تخلصت من ذاكرة التخزين المؤقت لبيانات L1 وهذه ذاكرة تخزين مؤقت للتعليمات بسعة 1 كيلوبايت ، فإن الشريحة بها 32 ميجابايت من ذاكرة التخزين المؤقت L11.328 ، ضاعف ذلك إذا كان لدى Tesla ذاكرة تخزين مؤقت لبيانات L1 وتحسبها على أنها 1 في الرسم الخاص بها

بالعودة إلى المسألة المطروحة ، كان من الغريب بالفعل أن بلاط التدريب لا يحتوي على ذاكرة DRAM ، ولكنه يصبح أكثر غرابة عندما تدرك أن SoC الخاص بهم لا يتضمن ذاكرة تخزين مؤقت L3 مشتركة أيضًا. من المهم أن تضع في اعتبارك أن هذا نظام محدد للغاية تم ضبطه بدقة لمهمة معينة للغاية بينما تحتوي معظم المعالجات على مجموعة واسعة من المكونات لتكون أكثر مرونة لتناسب جميع أنواع المهام. لذلك ، بقدر ما يبدو التصميم غريبًا ، قد تكون المكونات المفقودة التي تتوقع عادةً العثور عليها في SoC غير ضرورية وتمت إزالتها من أجل التكلفة والبساطة ، أو ربما كانت بمثابة عكاز من شأنه إبطاء سرعة النظام.

ترقبوا الجزء 3 والجزء 4.

تم نشره الآن: الكمبيوتر الفائق Dojo من Tesla يكسر جميع معايير الصناعة المعمول بها - CleanTechnica Deep Dive ، الجزء 3

 

هل تقدر أصالة CleanTechnica؟ النظر في أن تصبح عضو في CleanTechnica أو داعم أو فني أو سفير - أو راعي على Patreon.

 

 


الإعلانات


 


هل لديك نصيحة بخصوص CleanTechnica ، أو تريد الإعلان ، أو تريد اقتراح ضيف على بودكاست CleanTech Talk؟ اتصل بنا هنا.

أفلاطون. Web3 مُعاد تصوره. تضخيم ذكاء البيانات.
انقر هنا للوصول.

المصدر: https://cleantechnica.com/2021/08/22/teslas-dojo-supercomputer-breaks-all-established-industry-standards-cleantechnica-deep-dive-part-2/

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة