Zephyrnet Logosu

Tesla'nın Dojo Süper Bilgisayarı, Yerleşik Tüm Endüstri Standartlarını Kırıyor — CleanTechnica Derin Dalışı, Bölüm 2

Tarih:

Kaçırdıysanız, önce okuyun: Tesla'nın Dojo Süper Bilgisayarı, Yerleşik Tüm Endüstri Standartlarını Kırıyor — CleanTechnica Derin Dalışı, Bölüm 1.

Tesla Kuralları Yıkıyor

Tesla'nın Dojo eğitim karolarıyla yapmayı planladığı şey, gofreti parçalara ayırmaya yönelik tüm endüstri standardını bozmak. Sadece gofret üzerinde 25 SoC bırakmak ve o pahalı süper yüksek kaliteli silikonu kullanarak, büyük hacimli kabloların veya hatta bir anakartın düşük kaliteli silikonunun neden olduğu herhangi bir hız kaybı olmadan çiplerin birbirleriyle iletişim kurmasını sağlamak için. bildiğim kadarıyla, bu tamamen emsalsiz.

Bununla birlikte Tesla'nın karşılaştığı en büyük zorluk, sistemin bekledikleri gibi çalışmasını sağlamak için her bir SoC'nin kusursuz çalıştığı 5'e 5'lik bir bölüme sahip olduğundan emin olmaktır. Eğitim karosunun yuvarlak kenarlı şekli göz önüne alındığında, bunun tüm gofreti temsil etmesi ve her şeyin kusursuz çalışması gerekmesi çok olasıdır - sonuçta boş bir gofretin koyu gri rengi vardır.

Ancak Tesla için gofret verimi bir sorun olabilir. Yine de, Dojo için yalnızca 120 tamamen işlevsel gofrete ihtiyacı olduğu düşünülürse, bunu kaldırabilmelidir. Karşılaştırıldığında, Intel 2014'te 130,000'den fazla levha yaptı ve Tesla'nın kullandığı bu daha küçük levhalardan değil, 300 mm'lik büyük levhalardan bahsediyoruz. Ayrıca, daha küçük olan gofret, normal bir gofret gibi ağzına kadar bile doldurulmadığından, maliyetler önemli ölçüde daha düşük olmalıdır. Genel olarak, bir gofretin yapıldığı mükemmel kalitede silikon da ucuz değildir.


RAM Yok, Paylaşılan Önbellek Yok

Ayrıca benzeri görülmemiş olan (bildiğim kadarıyla), SoC dışında herhangi bir RAM'i olmayan bir bilgisayardır. Bir akıllı telefon ve Tesla'nın HW3'ünde bile SoC'nin dışında RAM yongaları var. En hızlı yeni sabit diskler bile (buna biraz sonra geleceğiz) Rgelişigüzel ADışı Erişim Mbellek, RAM kadar hızlıdır ve yerini tutamaz. Teorik olarak, piyasada bulunan en yeni PCIe-4 teknolojisi, DDR0.5 RAM'e sahip tüketici bilgisayarları için standart olan 3-20 GB/sn yerine yalnızca 25-4 GB/sn'ye, hatta bir sonraki için 50 GB/sn'ye ulaşacaktır. veri merkezlerinde kullanılmaya başlanan nesil DDR5 RAM. Boyut söz konusu olduğunda, akıllı telefonlar ve tüketici bilgisayarları genellikle 4-32 GB RAM kullanır ve profesyonel iş istasyonları 512 GB RAM'e bile ulaşabilir.

Peki Tesla'nın eğitim döşemesinde RAM yoksa ne verir? Daha da hızlı bir rasgele bellek katmanı var ve buna önbellek denir. Bu da geçen sefer ele aldığım bir şey ama bir kez daha detaylandıracağım. DRAM veya çoğu kişinin RAM dediği gibi, SoC/CPU onu çağırdığında, yaklaşık 60 nanosaniyelik bir yanıt süresine sahiptir. Oysa L3 önbelleği veya çip üzerindeki SRAM, 10 nanosaniye kadar düşük bir yanıt süresine sahip olabilir. Intel'in şu anda sahip olduğu en büyük L3 önbellek 57 MB, IBM'in rekoru 120 MB, AMD'nin en güçlü işlemcileri 256 MB L3 önbelleğe sahip ve Tesla'nın 3'da duyurulan HW2019 çipinde 64 MB SRAM var. 

Son olarak, Tesla'nın yeni Eğitim Düğümü 1.25 MB yüksek hızlı SRAM'a sahiptir. Bir dakika ne? Kulağa yanlış geliyor. Bunun nedeni, düğümlerden bahsetmemiz ve 354 düğümün bir hesaplama dizisi oluşturmasıdır. Bu, bir SoC'nin 424.8 MB önbelleğe sahip olduğu ve diğerlerini geride bıraktığı anlamına gelir. Bununla birlikte, eğlencenin burada bittiğine inanmıyorum, SRAM'ın doğrudan her düğümde bulunduğu ve Tesla'nın buna “Yüksek Hızlı” SRAM dediği gerçeği göz önüne alındığında, bir L3 önbelleğinden ziyade bahsettiğimizden şüpheleniyorum. daha da hızlı L2 önbelleği, IBM'in yaptığı gibi paylaşılmayan bir L3 önbelleği de bir olasılık olsa da (ancak bu önbelleklerin boyutu 10 MB, farklı bir lig olduğundan ve Intel'in başına 1 MB L2 önbelleği olduğundan bu olasılık çok daha düşüktür. çekirdek).

Düğüm başına 1.25 MB önbelleğin boyutu göz önüne alındığında, bunun bir L2 önbellek olduğuna bahse girerim. L1 ve L2 önbelleği ile L3 önbelleği arasındaki temel farklardan biri (biraz sonra ele alacağımız hız ve boyutlarının yanı sıra), L1 ve L2 önbelleğinin genellikle doğrudan her bir düğümde/çekirdekte yer almasıdır. genellikle (IBM hariç) çipin başka bir yerinde bulunur ve tüm çekirdekler/düğümler tarafından paylaşılır.

Yani, 1.25 MB bir L2 önbellek ise, bu onu daha önce bahsettiğimiz Intel çipinin önüne koyar. Intel'in L3 önbelleği 57 MB olmasına rağmen, çekirdek başına yalnızca 1 MB L2 önbelleğe sahiptir. Bununla birlikte, Intel'in 38 olan çekirdek sayısı, Tesla'nın 354 olan düğüm sayısından çok daha düşük olduğundan, genel olarak Intel işlemcideki önbellek miktarı çok daha düşüktür. Şimdiye kadar bahsetmediğim için, bir L1 önbelleğinin yanıt süresi 0.5 ns, bir L2 önbelleğinin yanıt süresi 3-4 ns ve daha önce de belirtildiği gibi, L3 önbelleğinin yanıt süresi 10 nanosaniye, ve DRAM'in 60 nanosaniye yanıt süresi vardır.

Ardından, görebileceğiniz gibi, Tesla'nın 1 önbellek veya i önbellek veya küçük harf L önbellek olarak etiketlediği bir şey var. Bahse girerim, bu en hızlı seviye L1 önbelleği ve daha spesifik olarak L1 Talimat önbelleğidir. Çoğu işlemcide biri yönergeler ve diğeri veriler için olmak üzere 2 L1 önbelleği bulunur; ancak geçmişte bu, her ikisi için de kullanılan tek bir önbellekti. Her halükarda, Tesla'nın L1 veri önbelleğini ortadan kaldırdığını ve bunun 32 KB'lik bir talimat önbelleği olduğunu varsayarsak, o zaman çipin 11.328 MB L1 önbelleği vardır; Tesla'nın bir L1 veri önbelleği varsa ve bunları grafiklerinde 1 olarak sayıyorsa bunun iki katı

Eldeki konuya dönersek, Eğitim Kutucuğunda DRAM olmaması zaten yeterince garipti, ancak SoC'lerinin de paylaşılan bir L3 önbelleği içermediğini fark ettiğinizde durum daha da tuhaflaşıyor. Bunun, çok özel bir görev için ince ayarlanmış çok özel bir sistem olduğunu akılda tutmak önemlidir, oysa çoğu işlemci, her tür göreve uyacak şekilde daha esnek olmak için daha geniş bir bileşen dizisine sahiptir. Bu nedenle, tasarımı ne kadar tuhaf görünse de, genellikle bir SoC'de bulmayı bekleyeceğiniz eksik bileşenler gereksiz olabilir ve maliyet ve basitlik uğruna kaldırılmış olabilir veya hatta yavaşlatacak bir koltuk değneği bile olabilirler. sistem.

3. ve 4. bölüm için takipte kalın.

Şimdi yayınlandı: Tesla'nın Dojo Süper Bilgisayarı, Yerleşik Tüm Endüstri Standartlarını Kırıyor — CleanTechnica Derin Dalışı, Bölüm 3

 

CleanTechnica'nın özgünlüğünü takdir etmek ister misiniz? Bir CleanTechnica Üyesi, Destekleyen, Teknisyen veya Büyükelçi - veya bir patron Patreon.

 

 


reklâm


 


CleanTechnica için bir ipucunuz mu var, reklam vermek mi yoksa CleanTech Talk podcast'imiz için bir misafir önermek mi istiyorsunuz? Burada bize ulaşın.

Plato Ai. Web3 Yeniden Düşünüldü. Güçlendirilmiş Veri Zekası.
Erişmek için buraya tıklayın.

Kaynak: https://cleantechnica.com/2021/08/22/teslas-dojo-supercomputer-breaks-all-founded-industry-standards-cleantechnica-deep-dive-part-2/

spot_img

En Son İstihbarat

spot_img