Λογότυπο Zephyrnet

DRAM Cache για GPU με SCM και υψηλό εύρος ζώνης

Ημερομηνία:

Ένα νέο τεχνικό έγγραφο με τίτλο «Εφλεκτική κρυφή μνήμη DRAM για το εύρος ζώνης για GPU με μνήμη κατηγορίας αποθήκευσης» δημοσιεύτηκε από ερευνητές της POSTECH και του Πανεπιστημίου Songsil.

Περίληψη

«Προτείνουμε να ξεπεραστεί ο περιορισμός χωρητικότητας μνήμης των GPU με μνήμη υψηλής χωρητικότητας κατηγορίας αποθήκευσης (SCM) και κρυφή μνήμη DRAM. Αυξάνοντας σημαντικά τη χωρητικότητα της μνήμης με το SCM, η GPU μπορεί να συλλάβει μεγαλύτερο κλάσμα του αποτυπώματος μνήμης από το HBM για φόρτους εργασίας που υπερκαλύπτουν τη μνήμη, επιτυγχάνοντας υψηλές ταχύτητες. Ωστόσο, η κρυφή μνήμη DRAM πρέπει να σχεδιαστεί προσεκτικά ώστε να αντιμετωπίζει τους περιορισμούς του λανθάνοντος χρόνου και του BW του SCM, ελαχιστοποιώντας ταυτόχρονα το γενικό κόστος και λαμβάνοντας υπόψη τα χαρακτηριστικά της GPU. Επειδή ο τεράστιος αριθμός νημάτων GPU μπορεί να παρακάμψει την κρυφή μνήμη DRAM, προτείνουμε πρώτα μια πολιτική παράκαμψης της κρυφής μνήμης DRAM με γνώση της SCM για GPU που λαμβάνει υπόψη τα πολυδιάστατα χαρακτηριστικά των προσβάσεων μνήμης από GPU με SCM για παράκαμψη της DRAM για δεδομένα με χρησιμότητα χαμηλής απόδοσης. Επιπλέον, για να μειωθούν οι ανιχνευτές κρυφής μνήμης DRAM και να αυξηθεί το αποτελεσματικό DRAM BW με ελάχιστο κόστος, προτείνουμε μια ρυθμιζόμενη κρυφή μνήμη ετικετών (CTC) που επαναχρησιμοποιεί μέρος της κρυφής μνήμης L2 σε ετικέτες κρυφής γραμμής DRAM. Η χωρητικότητα L2 που χρησιμοποιείται για το CTC μπορεί να ρυθμιστεί από τους χρήστες για προσαρμοστικότητα. Επιπλέον, για να ελαχιστοποιηθεί η κίνηση ανιχνευτή προσωρινής μνήμης DRAM από αστοχίες CTC, ο οργανισμός κρυφής μνήμης DRAM συγκεντρωτικών μεταδεδομένων στην τελευταία στήλη (AMIL) εντοπίζει όλες τις ετικέτες προσωρινής μνήμης DRAM σε μια στήλη μέσα σε μια σειρά. Το AMIL διατηρεί επίσης την πλήρη προστασία ECC, σε αντίθεση με την προηγούμενη οργάνωση Tag-and-Data (TAD) της κρυφής μνήμης DRAM. Επιπλέον, προτείνουμε στραγγαλισμό SCM για περιορισμό της ισχύος και εκμετάλλευση των λειτουργιών SLC/MLC της SCM για προσαρμογή στο αποτύπωμα μνήμης του φόρτου εργασίας. Ενώ οι τεχνικές μας μπορούν να χρησιμοποιηθούν για διαφορετικές συσκευές DRAM και SCM, εστιάζουμε σε έναν οργανισμό Ετερογενούς Στοίβας Μνήμης (HMS) που στοιβάζει μήτρες SCM πάνω από μήτρες DRAM για υψηλή απόδοση. Σε σύγκριση με το HBM, το HMS βελτιώνει την απόδοση έως και 12.5x (2.9x συνολικά) και μειώνει την ενέργεια έως και 89.3% (48.1% συνολικά). Σε σύγκριση με προηγούμενες εργασίες, μειώνουμε την επισκεψιμότητα της προσωρινής μνήμης DRAM και της επισκεψιμότητας εγγραφής SCM κατά 91-93% και 57-75%, αντίστοιχα.”

Βρείτε το τεχνικό χαρτί εδώ. Δημοσιεύθηκε Μάρτιος 2024.

Hong, Jeongmin, Sungjun Cho, Geonwoo Park, Wonhyuk Yang, Young-Ho Gong και Gwangsun Kim. "Κρυφή μνήμη DRAM με αποτελεσματικό εύρος ζώνης για GPU με μνήμη κατηγορίας αποθήκευσης." προ-εκτύπωση arXiv arXiv: 2403.09358 (2024).

spot_img

VC Cafe

VC Cafe

Τελευταία Νοημοσύνη

spot_img