شعار زيفيرنت

بطاقات RTX 3000 من NVIDIA تجعل عد التيرافلوب بلا فائدة

التاريخ:

روابط إعلانية

كان Teraflops طريقة شائعة لقياس "القوة الرسومية" لسنوات. يشير المصطلح إلى عدد العمليات الحسابية التي يمكن أن تقوم بها وحدة معالجة الرسومات ، ولكن أثناء وجودها في أوراق المواصفات إلى الأبد ، أصبح التيرافلوب مؤخرًا سائدًا ، حيث ظهرت في الرسائل التسويقية الموجودة في إطلاق وحدات التحكم مثل Xbox Series X. مع التهم الأساسية GPU بالوصول إلى خمسة أرقام ، من الجيد الحصول على نقطة مقارنة بسيطة. لسوء الحظ ، لم يكن تيرافلوب أقل فائدة.

يأتي مصطلح teraflop من FLOPs ، أو "عمليات النقطة العائمة في الثانية" ، والتي تعني ببساطة "العمليات الحسابية التي تتضمن نقاط عشرية في الثانية". تيرا تعني تريليون ، لذا فإن مجموع تيرافلوب يعني "تريليون عملية فاصلة عائمة في الثانية".

GPU الأكثر شعبية بين مستخدمي Steam اليوم ، NVIDIA الموقر GTX 1060، قادر على أداء 4.4 تيرافلوب ، يمكن لـ 2080 Ti الذي سيُغتصَب قريبًا التعامل مع حوالي 13.5 ويمكن لـ Xbox Series X القادمة إدارة 12. هذه الأرقام يتم حسابها بأخذ عدد النوى المظللة في الشريحة ، وضرب ذلك في سرعة ساعة الذروة للبطاقة ثم الضرب أن من خلال عدد التعليمات لكل ساعة. على عكس العديد من الأرقام التي نراها في مساحة الكمبيوتر الشخصي ، إنها عملية حسابية عادلة وشفافة ، لكن هذا لا يجعلها مقياسًا جيدًا لأداء الألعاب.

تصل كل عائلة GPU تقريبًا بهذه المكاسب عبر الأجيال

AMD's RX 580 ، وحدة معالجة الرسومات 6.17 تيرافلوب من 2017 ، على سبيل المثال ، تعمل بشكل مشابه لـ ر شنومكس، بطاقة 5.2 تيرافلوب بميزانية 12 أطلقتها الشركة العام الماضي. يمكن أن يُعزى هذا النوع من التحسين "المخفي" إلى العديد من العوامل ، بدءًا من التغييرات الهيكلية إلى مطوري الألعاب الذين يستخدمون ميزات جديدة ، ولكن كل عائلة GPU تصل تقريبًا بهذه المكاسب الأجيال. لهذا السبب ، من المتوقع أن يتفوق Xbox Series X ، على سبيل المثال ، على Xbox One X بأكثر مما تشير إليه أرقام "6 مقابل 5 تيرافلوب". (كما سبق لـ PS4 و PSXNUMX Pro.)

النقطة المهمة هي أنه حتى داخل نفس شركة وحدة معالجة الرسومات ، مع كل عام ، فإن التغييرات في طرق تصميم الرقائق والألعاب تجعل من الصعب تمييز ما تعنيه عبارة "تيرافلوب" بالضبط لأداء الألعاب. خذ بطاقة AMD وبطاقة NVIDIA من أي جيل والمقارنة لها قيمة أقل.

كل هذا يقودنا إلى سلسلة RTX 3000. وصلت هذه ببعض المواصفات المذهلة حقًا. تم إدراج بطاقة RTX 3070 ، بطاقة 500 دولار ، على أنها تحتوي على 5,888 نواة (اسم NVIDIA لـ shader) قادرة على 20 تيرافلوب. والبطاقة الرئيسية الجديدة التي تبلغ قيمتها 1,500 دولار ، RTX 3090؟ 10,496 نواة لـ 36 تيرافلوب. بالنسبة للسياق ، فإن RTX 2080 Ti ، اعتبارًا من الآن أفضل بطاقة رسومات "مستهلك" متوفرة ، بها 4,352 "نواة cuda". إذن ، زادت NVIDIA من عدد النوى في مركزها الرئيسي بأكثر من 140 بالمائة ، وقدرتها التيرافلوبس بأكثر من 160 بالمائة.

حسنًا ، لقد فعلت ، ولم تفعل.

تتكون بطاقات NVIDIA من العديد من "المعالجات المتعددة المتدفقة" أو SMs. يحتوي كل من 2080 Ti 68 SMs "Turing" ، من بين أشياء أخرى ، على 64 نواة Cuda "FP32" مخصصة لرياضيات الفاصلة العائمة و 64 نواة "INT32" مخصصة للرياضيات الصحيحة (حسابات بأرقام صحيحة). 

كان الابتكار الكبير في Turing SM ، بصرف النظر عن تسارع الذكاء الاصطناعي وتتبع الأشعة ، هو القدرة على تنفيذ حسابات الأعداد الصحيحة والعائمة في نفس الوقت. كان هذا تغييرًا كبيرًا عن الجيل السابق ، باسكال ، حيث كانت بنوك النوى تتقلب بين عدد صحيح ونقطة عائمة على أساس إما أو.

نفيديا أمبير SM

NVIDIA

بطاقات RTX 3000 مبنية على معمارية تسميها NVIDIA "Ampere" ، و SM الخاص بها ، في بعض النواحي ، يأخذ نهج Pascal و Turing. يحتفظ Ampere بنواة 64 FP32 كما كان من قبل ، ولكن تم تعيين 64 نواة أخرى الآن كـ "FP32 و INT32. " لذا ، فإن نصف نوى الأمبير مخصصة للفاصلة العائمة ، لكن النصف الآخر يمكن أن يؤدي إما الفاصلة العائمة أو الرياضيات الصحيحة ، تمامًا كما هو الحال في باسكال.

باستخدام هذا المفتاح ، تعد NVIDIA الآن كل SM على أنه يحتوي على 128 نواة FP32 ، بدلاً من 64 نواة تورينج. ربما يكون أفضل وصف لـ "3070 نواة cuda" في 5,888 هو "2,944 نواة cuda و 2,944 نواة يمكن كن كودا. "

نظرًا لأن الألعاب أصبحت أكثر تعقيدًا ، فقد بدأ المطورون في الاعتماد بشكل أكبر على الأعداد الصحيحة. اقترحت شريحة NVIDIA من الإصدار الأصلي 2018 RTX أن الرياضيات الصحيحة ، في المتوسط ​​، تشكل حوالي ربع عمليات GPU داخل اللعبة.

الجانب السلبي لـ Turing SM هو احتمال قلة الاستخدام. إذا كان عبء العمل ، على سبيل المثال ، عبارة عن 25 في المائة من الرياضيات الصحيحة ، فإن حوالي ربع نوى وحدة معالجة الرسومات يمكن أن تجلس دون أي شيء تفعله. هذا هو التفكير الكامن وراء هذا الهيكل الأساسي شبه الموحد الجديد ، وعلى الورق ، يكون له معنى كبير: لا يزال بإمكانك تشغيل عمليات عدد صحيح ونقطة عائمة في وقت واحد ، ولكن عندما تكون هذه النوى الصحيحة نائمة ، يمكنها تشغيل الفاصلة العائمة في حين أن.

[هذه الحلقة من ترقية تم إنتاجه قبل أن توضح NVIDIA تغييرات SM.]

عند إطلاق RTX 3000 من NVIDIA ، قال الرئيس التنفيذي Jensen Huang إن RTX 3070 كان "أقوى من RTX 2080 Ti." باستخدام ما نعرفه الآن عن تصميم Ampere ، وعدد صحيح ، ونقطة عائمة ، وسرعات الساعة ، و teraflops ، يمكننا أن نرى كيف يمكن أن تسير الأمور. في عبء العمل هذا "25 بالمائة" ، يمكن تشغيل 4,416،32 من هذه النوى الرياضيات FP1,472 ، مع معالجة 32،XNUMX INTXNUMX الضروري. 

إلى جانب جميع التغييرات الأخرى التي يجلبها Ampere ، يمكن أن يتفوق الطراز 3070 على 2080 Ti ربما بنسبة 10 في المائة ، على افتراض أن اللعبة لا تمانع في امتلاك ذاكرة 8 جيجابايت بدلاً من 11 جيجابايت للعمل معها. في سيناريو الحالة الأسوأ المطلق (والمستبعد للغاية) ، حيث يعتمد عبء العمل على عدد صحيح للغاية ، يمكن أن يتصرف مثل 2080. من ناحية أخرى ، إذا كانت اللعبة تتطلب القليل جدًا من الرياضيات الصحيحة ، فإن التعزيز على 2080 Ti يمكن أن تكون هائلة.

بغض النظر عن التخمين ، لدينا نقطة واحدة للمقارنة حتى الآن: أ مسبك الرقمية فيديو يقارن RTX 3080 بـ RTX 2080. DF شهدت زيادة بنسبة 70 إلى 90 بالمائة عبر الأجيال في العديد من الألعاب التي قدمتها NVIDIA للاختبار ، مع وجود فجوة في الأداء أعلى في العناوين التي تستخدم ميزات RTX مثل تتبع الأشعة. يعطي هذا النطاق لمحة عن نوع مكاسب الأداء المتغيرة التي نتوقعها بالنظر إلى النوى المشتركة الجديدة. سيكون من المثير للاهتمام أن نرى كيف تتصرف مجموعة أكبر من الألعاب ، حيث من المحتمل أن تكون NVIDIA قد وضعت أفضل ما لديها في اختيار اللعبة التي تمت الموافقة عليها. ما لن تراه هو ما يقرب من 3 أضعاف التحسن الذي قد يعنيه القفز من رقم تيرافلوب 2080 إلى رقم تيرافلوب 3080.

مع وصول بطاقات RTX 3000 الأولى في غضون أسابيع ، يمكنك توقع أن تعطيك المراجعات فكرة ثابتة عن أداء Ampere قريبًا. على الرغم من أنه حتى الآن من الآمن القول أن Ampere يمثل قفزة هائلة إلى الأمام لألعاب الكمبيوتر. من المحتمل أن يتداول الطراز 499 البالغ 3070 دولارًا في الضربات التجارية مع الرائد الحالي ، ويجب أن يقدم 799 3080 دولارًا أداءً أكثر من كافٍ لأولئك الذين ربما اختاروا سابقًا "Ti". ومع ذلك ، فإن هذه البطاقات تصطف ، فمن الواضح أنه لم يعد من الممكن تمثيل قيمتها بشخصية فريدة مثل التيرافلوب.

يتم اختيار جميع المنتجات التي أوصت بها Engadget من قبل فريق التحرير لدينا ، بغض النظر عن شركتنا الأم. تتضمن بعض قصصنا روابط تابعة. إذا اشتريت شيئًا من خلال أحد هذه الروابط ، فقد نربح عمولة تابعة.

الرسالة
التعليقات

مشاركة
162 مشاركة

مشاركة

شارك على تويتر

مشاركة

Source: https://www.engadget.com/nvidia-rtx-3090-3080-3070-cuda-core-int32-fp32-210059544.html

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة