जेफिरनेट लोगो

मेटा की अगली पीढ़ी की एआई चिप बिजली की खपत करते हुए विज्ञापन पेश करती है

दिनांक:

फरवरी में अपने दूसरे-जीन एआई एक्सेलेरेटर को छेड़ने के बाद, मेटा इस घरेलू सिलिकॉन पर फलियां बिखेरने के लिए तैयार है, जिसके बारे में कहा जाता है कि यह पहले से ही 16 क्षेत्रों में विज्ञापन अनुशंसाओं को सशक्त बना रहा है।

फेसबुक गोलियथ अपने विज्ञापन साम्राज्य के पीछे अनुशंसित मॉडलों को चलाने के लिए वीडियो स्ट्रीमिंग से लेकर मशीन लर्निंग तक सभी प्रकार के कार्यभार के लिए कस्टम एक्सेलेरेटर डिजाइन कर रहा है।

RSI नवीनतम जोड़ मेटा ट्रेनिंग इंफ़रेंस एक्सेलेरेटर (एमटीआईए) परिवार का दावा है कि पहली पीढ़ी के हिस्से की तुलना में 3 गुना अधिक प्रदर्शन और 1.5 गुना बिजली दक्षता लाभ है, जो कि द नेक्स्ट प्लेटफ़ॉर्म पर हमारे मित्र हैं। विश्लेषण किया पिछले साल।

मेटा के अनुसार, दूसरी पीढ़ी की चिप, जिसे हम स्थिरता के लिए MTIA v2 कहने जा रहे हैं, को हाइपरस्केलर की आंतरिक रैंकिंग और अनुशंसित मॉडल के लिए सर्वोत्तम संभव प्रदर्शन प्राप्त करने के लिए गणना, मेमोरी क्षमता और बैंडविड्थ को संतुलित करने के लिए डिज़ाइन किया गया था। .

डिज़ाइन में गहराई से जाने पर, त्वरक में प्रसंस्करण तत्वों (पीई) का 8×8 ग्रिड होता है जो MTIA v3.5 की तुलना में 7x उच्च सघन गणना प्रदर्शन या स्पार्सिटी सक्षम के साथ 1x उच्च प्रदर्शन प्रदान करता है।

मेटा के एआई त्वरक पहले से ही हाइपरस्केलर की रैंकिंग और अनुशंसा मॉडल को शक्ति प्रदान कर रहे हैं

ऊपर दिए गए मेटा के नवीनतम एआई एक्सेलेरेटर, पहले से ही हाइपरस्केलर की रैंकिंग और अनुशंसा मॉडल को शक्ति प्रदान कर रहे हैं - बड़ा करने के लिए क्लिक करें। स्रोत: मेटा

छोटे 5nm TSMC प्रक्रिया नोड का उपयोग करने और घड़ी की गति को 800MHz से 1.35GHz तक बढ़ाने के अलावा, मेटा ने कई वास्तुशिल्प और डिज़ाइन सुधारों को नोट किया है जिन्होंने नवीनतम भाग के प्रदर्शन में वृद्धि में योगदान दिया है। इनमें विरल गणना के लिए समर्थन, अधिक ऑन-डाई और ऑफ-डाई मेमोरी, और पुराने मॉडल की दोगुनी बैंडविड्थ के साथ एक उन्नत नेटवर्क-ऑन-चिप (NoC) शामिल है। यहां बताया गया है कि पहली और दूसरी पीढ़ी की तुलना कैसे की जाती है:

  एमटीआईए v1 एमटीआईए v2
प्रक्रिया तकनीक 7 एनएम टीएसएमसी 5 एनएम टीएसएमसी
मर क्षेत्र 373mm2 421mm2
पीई 8 × 8 ग्रिड 8 × 8 ग्रिड
घड़ी की गति 800MHz 1.35GHz
INT8 पूर्ण 102 TOPS 354/708* टॉप्स
एफपी16/बीएफ16 पूर्ण 51.2 TFLOPS 177/354* टीएफएलओपीएस
पीई मेम 128KB प्रति पीई 384KB प्रति पीई
ऑन-चिप मेम 128MB 256MB
ऑफ-चिप मेम 64GB 128GB
ऑफ-चिप मेम बीडब्ल्यू 176GB / s 204GB / s
कनेक्टिविटी 8x PCIe Gen 4.0 - 16GB/s 8x PCIe Gen 5.0 - 32GB/s
तेदेपा 25W 90W

* विरल प्रदर्शन. आप दोनों चिप्स का पूर्ण विवरण पा सकते हैं यहाँ उत्पन्न करें.

यह ध्यान दिया जाना चाहिए कि MTIA v2 वेब गोलियथ की GPUs की आवश्यकता को समाप्त नहीं करेगा। मेटा सुप्रीमो मार्क जुकरबर्ग पहले भी अपने मेगा-कॉर्पोरेशन की बात कह चुके हैं तैनात करेगा 350,000 एनवीडिया एच100 त्वरक और साल के अंत तक 600,000 एच100 के बराबर चालू हो जाएंगे।

इसके बजाय, एमटीआईए विशिष्ट कार्यों के अनुरूप कस्टम सिलिकॉन विकसित करने के लिए मेटा (और अन्य) के लिए एक तेजी से परिचित पैटर्न का पालन करता है। विचार यह है कि हालांकि किट सीपीयू और जीपीयू जितनी लचीली नहीं हो सकती है, लेकिन बड़े पैमाने पर तैनात होने पर एक एएसआईसी अधिक कुशल हो सकती है।

जबकि नवीनतम चिप अपने पूर्ववर्ती की तुलना में लगभग चार गुना अधिक बिजली की खपत करती है, यह फ़्लोटिंग पॉइंट प्रदर्शन को 7x तक उत्पन्न करने में सक्षम है। जीपीयू के मुकाबले, मेटा का नवीनतम त्वरक 7.8 TOPS प्रति वाट (TOPS/W) का प्रबंधन करता है, जो कि हम चर्चा की हमारे ब्लैकवेल कवरेज में, 100 TOPS/W पर Nvidia के H5.65 SXM को पीछे छोड़ देता है और 100 TOPS/W पर A3.12 SXM से दोगुने से भी अधिक है।

ऐसा कहने के बाद, यह स्पष्ट है कि मेटा ने अपने आंतरिक कार्यभार के अनुसार चिप को आकार देने के लिए काफी प्रयास किए हैं - अर्थात् अनुशंसित मॉडल पर अनुमान लगाना। इन्हें वैयक्तिकृत सुझाव प्रस्तुत करने के लिए डिज़ाइन किया गया है, जैसे कि जिन लोगों को आप जानते हैं या, अधिक महत्वपूर्ण रूप से मेटा के बिजनेस मॉडल के लिए, कौन से विज्ञापन आपके लिए सबसे अधिक प्रासंगिक हैं।

चिप्स को आवश्यकतानुसार स्केल करने के लिए भी डिज़ाइन किया गया है और कुल मिलाकर 72 त्वरक वाले रैक-आधारित सिस्टम में तैनात किया जा सकता है: प्रत्येक सिस्टम तीन चेसिस को जोड़ता है जिनमें से प्रत्येक में 12 कंप्यूट बोर्ड होते हैं और प्रति बोर्ड दो एमटीआईए वी2 चिप्स होते हैं।

प्रत्येक MTIA v2 चेसिस में 12 कंप्यूट बोर्ड होते हैं जिनमें से प्रत्येक में त्वरक की एक जोड़ी होती है

प्रत्येक MTIA v2 चेसिस में 12 कंप्यूट बोर्ड होते हैं, जिनमें से प्रत्येक में त्वरक की एक जोड़ी होती है... बड़ा करने के लिए क्लिक करें। स्रोत: मेटा.

कार्यभार को तैनात करने के मामले में, मेटा PyTorch फ्रेमवर्क और ट्राइटन कंपाइलर पर बहुत अधिक निर्भर है। हमने इस संयोजन का उपयोग विभिन्न जीपीयू और एक्सेलेरेटर पर कार्य करने के लिए देखा है, आंशिक रूप से क्योंकि यह विशिष्ट हार्डवेयर के लिए अनुकूलित कोड विकसित करने की आवश्यकता को काफी हद तक समाप्त कर देता है।

मेटा, एक प्रमुख रहा है समर्थक PyTorch का, जिसे उसने लिनक्स फाउंडेशन को बागडोर सौंपने से पहले विकसित किया था, क्योंकि यह इंजीनियरों को एआई अनुप्रयोगों को विकसित करने की सुविधा देता है जो एनवीडिया और एएमडी से विभिन्न प्रकार के जीपीयू हार्डवेयर पर चल सकते हैं। तो यह समझ में आता है कि मेटा उन्हीं तकनीकों को अपने चिप्स के साथ नियोजित करना चाहेगा।

वास्तव में, मेटा का दावा है कि अपने सॉफ्टवेयर और हार्डवेयर को एक साथ विकसित करके वह मौजूदा जीपीयू प्लेटफार्मों की तुलना में अधिक दक्षता हासिल करने में सक्षम था और भविष्य के अनुकूलन के माध्यम से और भी अधिक प्रदर्शन हासिल करने की उम्मीद करता है।

MTIA v2 निश्चित रूप से मेटा से देखा जाने वाला आखिरी सिलिकॉन नहीं होगा। सोशल मीडिया दिग्गज का कहना है कि उसके पास कई चिप डिजाइन कार्यक्रम चल रहे हैं, जिनमें एक ऐसा भी है जो भविष्य के जेनरेटर एआई सिस्टम का समर्थन करेगा। ®

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी