حافظه پنهان DRAM برای پردازنده های گرافیکی با SCM و پهنای باند بالا

پژوهشگران POSTECH و دانشگاه Songsil یک مقاله فنی جدید با عنوان "کش DRAM با پهنای باند موثر برای پردازنده های گرافیکی با حافظه کلاس ذخیره سازی" منتشر کردند.

چکیده

ما پیشنهاد می کنیم بر محدودیت ظرفیت حافظه پردازنده های گرافیکی با حافظه کلاس ذخیره سازی با ظرفیت بالا (SCM) و کش DRAM غلبه کنیم. با افزایش قابل توجه ظرفیت حافظه با SCM، GPU می‌تواند بخش بزرگ‌تری از فضای حافظه را نسبت به HBM برای بارهای کاری که بیش از حد از حافظه استفاده می‌کنند، جذب کند و به سرعت‌های بالا دست یابد. با این حال، حافظه نهان DRAM باید با دقت طراحی شود تا محدودیت‌های تاخیر و BW SCM را برطرف کند و در عین حال هزینه‌های سربار را به حداقل برساند و ویژگی‌های GPU را در نظر بگیرد. از آنجایی که تعداد انبوه رشته‌های GPU می‌توانند حافظه نهان DRAM را از بین ببرند، ما ابتدا یک سیاست دور زدن حافظه پنهان DRAM آگاه از SCM را برای GPUها پیشنهاد می‌کنیم که ویژگی‌های چند بعدی دسترسی‌های حافظه توسط GPU‌های دارای SCM را در نظر می‌گیرد تا از DRAM برای داده‌هایی با کارایی پایین دور بزند. علاوه بر این، برای کاهش پروب‌های کش DRAM و افزایش موثر DRAM BW با حداقل هزینه، ما یک کش برچسب قابل تنظیم (CTC) را پیشنهاد می‌کنیم که بخشی از کش L2 را برای ذخیره تگ‌های کش DRAM تغییر می‌دهد. ظرفیت L2 مورد استفاده برای CTC می تواند توسط کاربران برای سازگاری تنظیم شود. علاوه بر این، برای به حداقل رساندن ترافیک کاوشگر حافظه پنهان DRAM از عدم دسترسی به CTC، سازمان حافظه پنهان DRAM ابرداده جمع‌آوری شده در آخرین ستون (AMIL) همه تگ‌های کش DRAM را در یک ستون واحد در یک ردیف قرار می‌دهد. AMIL همچنین برخلاف سازمان Tag-And-Data (TAD) حافظه پنهان DRAM، حفاظت کامل ECC را حفظ می کند. علاوه بر این، ما SCM throttling را برای کاهش توان و استفاده از حالت‌های SLC/MLC SCM برای انطباق با ردپای حافظه بار کاری پیشنهاد می‌کنیم. در حالی که تکنیک‌های ما را می‌توان برای دستگاه‌های مختلف DRAM و SCM استفاده کرد، ما بر روی یک سازمان پشته حافظه ناهمگن (HMS) تمرکز می‌کنیم که برای عملکرد بالا، قالب‌های SCM را در بالای قالب‌های DRAM قرار می‌دهد. در مقایسه با HBM، HMS عملکرد را تا 12.5 برابر (در کل 2.9 برابر) بهبود می بخشد و انرژی را تا 89.3٪ (48.1٪ در کل) کاهش می دهد. در مقایسه با کارهای قبلی، کاوش کش DRAM و ترافیک نوشتن SCM را به ترتیب 91-93٪ و 57-75٪ کاهش می دهیم.

فنی را پیدا کنید کاغذ اینجا. منتشر شده در مارس 2024.

هونگ، جونگمین، سونگ جوون چو، پارک جئون وو، وونهیوک یانگ، یانگ هو گونگ و گوانگسون کیم. کش DRAM با پهنای باند موثر برای پردازنده‌های گرافیکی با حافظه کلاس ذخیره‌سازی. پیش چاپ arXiv arXiv: 2403.09358 (2024).

محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
منبع: https://semiengineering.com/dram-cache-for-gpus-with-scm-and-high-bandwidth/

هوش داده های تولیدی

حافظه پنهان DRAM برای پردازنده های گرافیکی با SCM و پهنای باند بالا

هند آزمایش سیستم اژدر موشکی را انجام می دهد

نیروی دریایی مدرن 2024: ایرباس UH-72 بدون سرنشین را به تفنگداران دریایی ایالات متحده می فرستد

جدیدترین اطلاعات

تحلیلگر: این بار متفاوت است، افت بیت کوین ناشی از فلاش اوت اهرمی نیست

تأثیر نوسانات FX بر درآمد سه ماهه اول شرکت Financière Tradition

موضع دولت در مورد خرید نفت روسیه؛ صرفه جویی 8 میلیارد دلاری در صورتحساب واردات هند

شبکه Mode کمپین Airdrop را در لایه 2 اتریوم راه اندازی کرد | BitPinas

همکاری دفاعی هند و ایالات متحده در دیدار دو روزه در دهلی نو تشدید می شود

RWA در تمرکز: متولی دارایی دیجیتال تحت نظارت MAS، Propine پشتیبانی از استیبل کوین دلاری FXD دلاری Fathom را در شبکه XDC معرفی می کند