لوگوی Zephyrnet

حافظه پنهان DRAM برای پردازنده های گرافیکی با SCM و پهنای باند بالا

تاریخ:

پژوهشگران POSTECH و دانشگاه Songsil یک مقاله فنی جدید با عنوان "کش DRAM با پهنای باند موثر برای پردازنده های گرافیکی با حافظه کلاس ذخیره سازی" منتشر کردند.

چکیده

ما پیشنهاد می کنیم بر محدودیت ظرفیت حافظه پردازنده های گرافیکی با حافظه کلاس ذخیره سازی با ظرفیت بالا (SCM) و کش DRAM غلبه کنیم. با افزایش قابل توجه ظرفیت حافظه با SCM، GPU می‌تواند بخش بزرگ‌تری از فضای حافظه را نسبت به HBM برای بارهای کاری که بیش از حد از حافظه استفاده می‌کنند، جذب کند و به سرعت‌های بالا دست یابد. با این حال، حافظه نهان DRAM باید با دقت طراحی شود تا محدودیت‌های تاخیر و BW SCM را برطرف کند و در عین حال هزینه‌های سربار را به حداقل برساند و ویژگی‌های GPU را در نظر بگیرد. از آنجایی که تعداد انبوه رشته‌های GPU می‌توانند حافظه نهان DRAM را از بین ببرند، ما ابتدا یک سیاست دور زدن حافظه پنهان DRAM آگاه از SCM را برای GPUها پیشنهاد می‌کنیم که ویژگی‌های چند بعدی دسترسی‌های حافظه توسط GPU‌های دارای SCM را در نظر می‌گیرد تا از DRAM برای داده‌هایی با کارایی پایین دور بزند. علاوه بر این، برای کاهش پروب‌های کش DRAM و افزایش موثر DRAM BW با حداقل هزینه، ما یک کش برچسب قابل تنظیم (CTC) را پیشنهاد می‌کنیم که بخشی از کش L2 را برای ذخیره تگ‌های کش DRAM تغییر می‌دهد. ظرفیت L2 مورد استفاده برای CTC می تواند توسط کاربران برای سازگاری تنظیم شود. علاوه بر این، برای به حداقل رساندن ترافیک کاوشگر حافظه پنهان DRAM از عدم دسترسی به CTC، سازمان حافظه پنهان DRAM ابرداده جمع‌آوری شده در آخرین ستون (AMIL) همه تگ‌های کش DRAM را در یک ستون واحد در یک ردیف قرار می‌دهد. AMIL همچنین برخلاف سازمان Tag-And-Data (TAD) حافظه پنهان DRAM، حفاظت کامل ECC را حفظ می کند. علاوه بر این، ما SCM throttling را برای کاهش توان و استفاده از حالت‌های SLC/MLC SCM برای انطباق با ردپای حافظه بار کاری پیشنهاد می‌کنیم. در حالی که تکنیک‌های ما را می‌توان برای دستگاه‌های مختلف DRAM و SCM استفاده کرد، ما بر روی یک سازمان پشته حافظه ناهمگن (HMS) تمرکز می‌کنیم که برای عملکرد بالا، قالب‌های SCM را در بالای قالب‌های DRAM قرار می‌دهد. در مقایسه با HBM، HMS عملکرد را تا 12.5 برابر (در کل 2.9 برابر) بهبود می بخشد و انرژی را تا 89.3٪ (48.1٪ در کل) کاهش می دهد. در مقایسه با کارهای قبلی، کاوش کش DRAM و ترافیک نوشتن SCM را به ترتیب 91-93٪ و 57-75٪ کاهش می دهیم.

فنی را پیدا کنید کاغذ اینجا. منتشر شده در مارس 2024.

هونگ، جونگمین، سونگ جوون چو، پارک جئون وو، وونهیوک یانگ، یانگ هو گونگ و گوانگسون کیم. کش DRAM با پهنای باند موثر برای پردازنده‌های گرافیکی با حافظه کلاس ذخیره‌سازی. پیش چاپ arXiv arXiv: 2403.09358 (2024).

نقطه_img

جدیدترین اطلاعات

نقطه_img