Zephyrnet Logosu

SCM ve Yüksek Bant Genişliğine Sahip GPU'lar için DRAM Önbelleği

Tarih:

POBTEK ve Songsil Üniversitesi'ndeki araştırmacılar tarafından “Depolama Sınıfı Belleğe Sahip GPU'lar için Bant Genişliği Etkin DRAM Önbelleği” başlıklı yeni bir teknik makale yayımlandı.

Özet

“Yüksek kapasiteli Depolama Sınıfı Bellek (SCM) ve DRAM önbelleğiyle GPU'ların bellek kapasitesi sınırlamasının üstesinden gelmeyi öneriyoruz. GPU, SCM ile bellek kapasitesini önemli ölçüde artırarak, belleğe aşırı abone olan iş yükleri için bellek ayak izinin daha büyük bir kısmını yakalayabilir ve yüksek hızlanmalar elde edebilir. Bununla birlikte, DRAM önbelleğinin, maliyet ek yükünü en aza indirirken ve GPU'nun özelliklerini dikkate alırken, SCM'nin gecikme ve BW sınırlamalarını ele alacak şekilde dikkatli bir şekilde tasarlanması gerekir. Çok sayıda GPU iş parçacığının DRAM önbelleğini tahrip edebilmesi nedeniyle, öncelikle GPU'lar için, düşük performanslı yardımcı programa sahip veriler için DRAM'i atlamak üzere SCM'li GPU'ların bellek erişimlerinin çok boyutlu özelliklerini dikkate alan bir SCM bilinçli DRAM önbellek atlama politikası öneriyoruz. Ayrıca, DRAM önbellek araştırmalarını azaltmak ve minimum maliyetle etkili DRAM BW'yi artırmak için, L2 önbelleğinin bir kısmını DRAM önbellek etiketlerini önbelleğe almak üzere yeniden kullanan bir Yapılandırılabilir Etiket Önbelleği (CTC) öneriyoruz. CTC için kullanılan L2 kapasitesi, uyarlanabilirlik açısından kullanıcılar tarafından ayarlanabilir. Ayrıca, CTC kayıplarından kaynaklanan DRAM önbellek araştırma trafiğini en aza indirmek için, Son Sütundaki Toplu Meta Veri (AMIL) DRAM önbellek organizasyonumuz, tüm DRAM önbellek etiketlerini bir satır içindeki tek bir sütunda birlikte konumlandırır. AMIL aynı zamanda önceki DRAM önbelleğinin Etiket ve Veri (TAD) organizasyonundan farklı olarak tam ECC korumasını da korur. Ek olarak, gücü azaltmak için SCM kısıtlamasını ve iş yükünün bellek alanına uyum sağlamak için SCM'nin SLC/MLC modlarından yararlanmayı öneriyoruz. Tekniklerimiz farklı DRAM ve SCM cihazları için kullanılabilirken, yüksek performans için SCM kalıplarını DRAM kalıplarının üzerine istifleyen Heterojen Bellek Yığını (HMS) organizasyonuna odaklanıyoruz. HBM ile karşılaştırıldığında HMS, performansı 12.5 kata kadar (toplamda 2.9 kat) artırır ve enerjiyi %89.3'e kadar (toplamda %48.1) azaltır. Önceki çalışmalarla karşılaştırıldığında, DRAM önbellek incelemesini ve SCM yazma trafiğini sırasıyla %91-93 ve %57-75 oranında azalttık.”

teknik bul kağıt burada. Mart 2024'te yayınlandı.

Hong, Jeongmin, Sungjun Cho, Geonwoo Park, Wonhyuk Yang, Young-Ho Gong ve Gwangsun Kim. “Depolama Sınıfı Belleğe Sahip GPU'lar için Bant Genişliği Etkin DRAM Önbelleği.” arXiv ön baskı arXiv: 2403.09358 (2024).

spot_img

En Son İstihbarat

spot_img