پژوهشگران POSTECH و دانشگاه Songsil یک مقاله فنی جدید با عنوان "کش DRAM با پهنای باند موثر برای پردازنده های گرافیکی با حافظه کلاس ذخیره سازی" منتشر کردند.
چکیده
ما پیشنهاد می کنیم بر محدودیت ظرفیت حافظه پردازنده های گرافیکی با حافظه کلاس ذخیره سازی با ظرفیت بالا (SCM) و کش DRAM غلبه کنیم. با افزایش قابل توجه ظرفیت حافظه با SCM، GPU میتواند بخش بزرگتری از فضای حافظه را نسبت به HBM برای بارهای کاری که بیش از حد از حافظه استفاده میکنند، جذب کند و به سرعتهای بالا دست یابد. با این حال، حافظه نهان DRAM باید با دقت طراحی شود تا محدودیتهای تاخیر و BW SCM را برطرف کند و در عین حال هزینههای سربار را به حداقل برساند و ویژگیهای GPU را در نظر بگیرد. از آنجایی که تعداد انبوه رشتههای GPU میتوانند حافظه نهان DRAM را از بین ببرند، ما ابتدا یک سیاست دور زدن حافظه پنهان DRAM آگاه از SCM را برای GPUها پیشنهاد میکنیم که ویژگیهای چند بعدی دسترسیهای حافظه توسط GPUهای دارای SCM را در نظر میگیرد تا از DRAM برای دادههایی با کارایی پایین دور بزند. علاوه بر این، برای کاهش پروبهای کش DRAM و افزایش موثر DRAM BW با حداقل هزینه، ما یک کش برچسب قابل تنظیم (CTC) را پیشنهاد میکنیم که بخشی از کش L2 را برای ذخیره تگهای کش DRAM تغییر میدهد. ظرفیت L2 مورد استفاده برای CTC می تواند توسط کاربران برای سازگاری تنظیم شود. علاوه بر این، برای به حداقل رساندن ترافیک کاوشگر حافظه پنهان DRAM از عدم دسترسی به CTC، سازمان حافظه پنهان DRAM ابرداده جمعآوری شده در آخرین ستون (AMIL) همه تگهای کش DRAM را در یک ستون واحد در یک ردیف قرار میدهد. AMIL همچنین برخلاف سازمان Tag-And-Data (TAD) حافظه پنهان DRAM، حفاظت کامل ECC را حفظ می کند. علاوه بر این، ما SCM throttling را برای کاهش توان و استفاده از حالتهای SLC/MLC SCM برای انطباق با ردپای حافظه بار کاری پیشنهاد میکنیم. در حالی که تکنیکهای ما را میتوان برای دستگاههای مختلف DRAM و SCM استفاده کرد، ما بر روی یک سازمان پشته حافظه ناهمگن (HMS) تمرکز میکنیم که برای عملکرد بالا، قالبهای SCM را در بالای قالبهای DRAM قرار میدهد. در مقایسه با HBM، HMS عملکرد را تا 12.5 برابر (در کل 2.9 برابر) بهبود می بخشد و انرژی را تا 89.3٪ (48.1٪ در کل) کاهش می دهد. در مقایسه با کارهای قبلی، کاوش کش DRAM و ترافیک نوشتن SCM را به ترتیب 91-93٪ و 57-75٪ کاهش می دهیم.
فنی را پیدا کنید کاغذ اینجا. منتشر شده در مارس 2024.
هونگ، جونگمین، سونگ جوون چو، پارک جئون وو، وونهیوک یانگ، یانگ هو گونگ و گوانگسون کیم. کش DRAM با پهنای باند موثر برای پردازندههای گرافیکی با حافظه کلاس ذخیرهسازی. پیش چاپ arXiv arXiv: 2403.09358 (2024).
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://semiengineering.com/dram-cache-for-gpus-with-scm-and-high-bandwidth/