जेफिरनेट लोगो

एससीएम और उच्च बैंडविड्थ वाले जीपीयू के लिए डीआरएएम कैश

दिनांक:

POSTECH और सोंगसिल यूनिवर्सिटी के शोधकर्ताओं द्वारा "स्टोरेज-क्लास मेमोरी वाले GPU के लिए बैंडविड्थ-प्रभावी DRAM कैश" नामक एक नया तकनीकी पेपर प्रकाशित किया गया था।

सार

“हम उच्च क्षमता वाले स्टोरेज-क्लास मेमोरी (एससीएम) और डीआरएएम कैश के साथ जीपीयू की मेमोरी क्षमता सीमा पर काबू पाने का प्रस्ताव करते हैं। एससीएम के साथ मेमोरी क्षमता में उल्लेखनीय वृद्धि करके, जीपीयू मेमोरी को ओवरसब्सक्राइब करने वाले वर्कलोड के लिए एचबीएम की तुलना में मेमोरी फ़ुटप्रिंट के एक बड़े हिस्से को कैप्चर कर सकता है, जिससे उच्च स्पीडअप प्राप्त होता है। हालाँकि, लागत ओवरहेड को कम करने और GPU की विशेषताओं पर विचार करते हुए SCM की विलंबता और BW सीमाओं को संबोधित करने के लिए DRAM कैश को सावधानीपूर्वक डिज़ाइन करने की आवश्यकता है। क्योंकि बड़ी संख्या में GPU थ्रेड्स DRAM कैश को नष्ट कर सकते हैं, हम पहले GPU के लिए SCM-जागरूक DRAM कैश बायपास नीति का प्रस्ताव करते हैं जो कम प्रदर्शन उपयोगिता वाले डेटा के लिए DRAM को बायपास करने के लिए SCM के साथ GPU द्वारा मेमोरी एक्सेस की बहु-आयामी विशेषताओं पर विचार करता है। इसके अलावा, DRAM कैश जांच को कम करने और न्यूनतम लागत के साथ प्रभावी DRAM BW को बढ़ाने के लिए, हम एक कॉन्फ़िगर करने योग्य टैग कैश (CTC) का प्रस्ताव करते हैं जो L2 कैश के हिस्से को DRAM कैशलाइन टैग को कैश करने के लिए पुन: उपयोग करता है। सीटीसी के लिए उपयोग की जाने वाली एल2 क्षमता को उपयोगकर्ताओं द्वारा अनुकूलनशीलता के लिए समायोजित किया जा सकता है। इसके अलावा, सीटीसी चूक से डीआरएएम कैश जांच ट्रैफ़िक को कम करने के लिए, हमारा एकत्रित मेटाडेटा-इन-लास्ट-कॉलम (एएमआईएल) डीआरएएम कैश संगठन एक पंक्ति के भीतर एक कॉलम में सभी डीआरएएम कैशलाइन टैग को सह-स्थानित करता है। पूर्व DRAM कैश के टैग-एंड-डेटा (TAD) संगठन के विपरीत, AMIL पूर्ण ECC सुरक्षा भी बरकरार रखता है। इसके अतिरिक्त, हम बिजली को कम करने के लिए एससीएम थ्रॉटलिंग का प्रस्ताव करते हैं और वर्कलोड की मेमोरी फ़ुटप्रिंट को अनुकूलित करने के लिए एससीएम के एसएलसी/एमएलसी मोड का उपयोग करते हैं। जबकि हमारी तकनीकों का उपयोग विभिन्न DRAM और SCM उपकरणों के लिए किया जा सकता है, हम एक विषम मेमोरी स्टैक (HMS) संगठन पर ध्यान केंद्रित करते हैं जो उच्च प्रदर्शन के लिए SCM डाइज़ को DRAM डाइज़ के शीर्ष पर रखता है। एचबीएम की तुलना में, एचएमएस 12.5x (कुल मिलाकर 2.9x) तक प्रदर्शन में सुधार करता है और ऊर्जा को 89.3% (कुल मिलाकर 48.1%) तक कम करता है। पिछले कार्यों की तुलना में, हमने DRAM कैश जांच और SCM राइट ट्रैफ़िक को क्रमशः 91-93% और 57-75% कम कर दिया है।

तकनीकी खोजें कागज यहाँ. मार्च 2024 को प्रकाशित।

होंग, जियोंगमिन, सुंगजुन चो, जियोनवू पार्क, वोन्ह्युक यांग, यंग-हो गोंग और ग्वांगसन किम। "स्टोरेज-क्लास मेमोरी वाले जीपीयू के लिए बैंडविड्थ-प्रभावी DRAM कैश।" arXiv प्रीप्रिंट arXiv: 2403.09358 (2024).

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी