شعار زيفيرنت

ذاكرة تخزين مؤقت DRAM لوحدات معالجة الرسومات ذات SCM وعرض النطاق الترددي العالي

التاريخ:

تم نشر ورقة تقنية جديدة بعنوان "ذاكرة التخزين المؤقت DRAM ذات النطاق الترددي الفعال لوحدات معالجة الرسومات ذات ذاكرة فئة التخزين" من قبل باحثين في POSTECH وجامعة Songsil.

ملخص

"نحن نقترح التغلب على القيود المفروضة على سعة الذاكرة لوحدات معالجة الرسومات ذات ذاكرة فئة التخزين عالية السعة (SCM) وذاكرة التخزين المؤقت DRAM. من خلال زيادة سعة الذاكرة بشكل كبير باستخدام SCM، يمكن لوحدة معالجة الرسومات التقاط جزء أكبر من مساحة الذاكرة مقارنة بـ HBM لأحمال العمل التي تستهلك الذاكرة بشكل زائد، مما يحقق سرعات عالية. ومع ذلك، يجب أن يتم تصميم ذاكرة التخزين المؤقت DRAM بعناية لمعالجة قيود زمن الوصول وعرض العرض الخاصة بـ SCM مع تقليل التكلفة العامة ومراعاة خصائص وحدة معالجة الرسومات. نظرًا لأن العدد الهائل من مؤشرات ترابط وحدة معالجة الرسومات يمكن أن يسحق ذاكرة التخزين المؤقت DRAM، فإننا نقترح أولاً سياسة تجاوز ذاكرة التخزين المؤقت DRAM المدركة لـ SCM لوحدات معالجة الرسومات التي تأخذ في الاعتبار الخصائص متعددة الأبعاد للوصول إلى الذاكرة بواسطة وحدات معالجة الرسومات مع SCM لتجاوز DRAM للبيانات ذات الأداء المنخفض. بالإضافة إلى ذلك، لتقليل تحقيقات ذاكرة التخزين المؤقت DRAM وزيادة فعالية DRAM BW بأقل تكلفة، نقترح ذاكرة تخزين مؤقت قابلة للتكوين (CTC) تعيد استخدام جزء من ذاكرة التخزين المؤقت L2 لتخزين علامات ذاكرة تخزين DRAM مؤقتًا. يمكن للمستخدمين تعديل سعة L2 المستخدمة في CTC من أجل القدرة على التكيف. علاوة على ذلك، لتقليل حركة مرور مسبار ذاكرة التخزين المؤقت DRAM من أخطاء CTC، تقوم مؤسسة ذاكرة التخزين المؤقت DRAM لبيانات التعريف المجمعة في العمود الأخير (AMIL) بالمشاركة في تحديد موقع جميع علامات ذاكرة التخزين المؤقت DRAM في عمود واحد داخل صف واحد. تحتفظ AMIL أيضًا بحماية ECC الكاملة، على عكس منظمة العلامات والبيانات (TAD) الخاصة بذاكرة التخزين المؤقت DRAM السابقة. بالإضافة إلى ذلك، نقترح اختناق SCM لتقليل الطاقة واستغلال أوضاع SLC/MLC الخاصة بـ SCM للتكيف مع أثر ذاكرة عبء العمل. بينما يمكن استخدام تقنياتنا لمختلف أجهزة DRAM وSCM، فإننا نركز على تنظيم مكدس الذاكرة غير المتجانس (HMS) الذي يقوم بتكديس قوالب SCM فوق قوالب DRAM للحصول على أداء عالٍ. بالمقارنة مع HBM، تعمل HMS على تحسين الأداء بما يصل إلى 12.5x (2.9x بشكل عام) وتقليل الطاقة بنسبة تصل إلى 89.3% (48.1% بشكل عام). بالمقارنة مع الأعمال السابقة، قمنا بتقليل مسبار ذاكرة التخزين المؤقت DRAM وحركة كتابة SCM بنسبة 91-93% و57-75% على التوالي.

ابحث عن التقنية ورقة هنا. تم النشر في مارس 2024.

هونغ، جيونج مين، سونج جون تشو، جيون وو بارك، وونهيوك يانج، يونج هو جونج، وجوانجسون كيم. "ذاكرة التخزين المؤقت DRAM ذات النطاق الترددي الفعال لوحدات معالجة الرسومات ذات ذاكرة فئة التخزين." arXiv preprint arXiv: 2403.09358 (2024).

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة