फरवरी में अपने दूसरे-जीन एआई एक्सेलेरेटर को छेड़ने के बाद, मेटा इस घरेलू सिलिकॉन पर फलियां बिखेरने के लिए तैयार है, जिसके बारे में कहा जाता है कि यह पहले से ही 16 क्षेत्रों में विज्ञापन अनुशंसाओं को सशक्त बना रहा है।
फेसबुक गोलियथ अपने विज्ञापन साम्राज्य के पीछे अनुशंसित मॉडलों को चलाने के लिए वीडियो स्ट्रीमिंग से लेकर मशीन लर्निंग तक सभी प्रकार के कार्यभार के लिए कस्टम एक्सेलेरेटर डिजाइन कर रहा है।
RSI नवीनतम जोड़ मेटा ट्रेनिंग इंफ़रेंस एक्सेलेरेटर (एमटीआईए) परिवार का दावा है कि पहली पीढ़ी के हिस्से की तुलना में 3 गुना अधिक प्रदर्शन और 1.5 गुना बिजली दक्षता लाभ है, जो कि द नेक्स्ट प्लेटफ़ॉर्म पर हमारे मित्र हैं। विश्लेषण किया पिछले साल।
मेटा के अनुसार, दूसरी पीढ़ी की चिप, जिसे हम स्थिरता के लिए MTIA v2 कहने जा रहे हैं, को हाइपरस्केलर की आंतरिक रैंकिंग और अनुशंसित मॉडल के लिए सर्वोत्तम संभव प्रदर्शन प्राप्त करने के लिए गणना, मेमोरी क्षमता और बैंडविड्थ को संतुलित करने के लिए डिज़ाइन किया गया था। .
डिज़ाइन में गहराई से जाने पर, त्वरक में प्रसंस्करण तत्वों (पीई) का 8×8 ग्रिड होता है जो MTIA v3.5 की तुलना में 7x उच्च सघन गणना प्रदर्शन या स्पार्सिटी सक्षम के साथ 1x उच्च प्रदर्शन प्रदान करता है।
ऊपर दिए गए मेटा के नवीनतम एआई एक्सेलेरेटर, पहले से ही हाइपरस्केलर की रैंकिंग और अनुशंसा मॉडल को शक्ति प्रदान कर रहे हैं - बड़ा करने के लिए क्लिक करें। स्रोत: मेटा
छोटे 5nm TSMC प्रक्रिया नोड का उपयोग करने और घड़ी की गति को 800MHz से 1.35GHz तक बढ़ाने के अलावा, मेटा ने कई वास्तुशिल्प और डिज़ाइन सुधारों को नोट किया है जिन्होंने नवीनतम भाग के प्रदर्शन में वृद्धि में योगदान दिया है। इनमें विरल गणना के लिए समर्थन, अधिक ऑन-डाई और ऑफ-डाई मेमोरी, और पुराने मॉडल की दोगुनी बैंडविड्थ के साथ एक उन्नत नेटवर्क-ऑन-चिप (NoC) शामिल है। यहां बताया गया है कि पहली और दूसरी पीढ़ी की तुलना कैसे की जाती है:
एमटीआईए v1 | एमटीआईए v2 | |
---|---|---|
प्रक्रिया तकनीक | 7 एनएम टीएसएमसी | 5 एनएम टीएसएमसी |
मर क्षेत्र | 373mm2 | 421mm2 |
पीई | 8 × 8 ग्रिड | 8 × 8 ग्रिड |
घड़ी की गति | 800MHz | 1.35GHz |
INT8 पूर्ण | 102 TOPS | 354/708* टॉप्स |
एफपी16/बीएफ16 पूर्ण | 51.2 TFLOPS | 177/354* टीएफएलओपीएस |
पीई मेम | 128KB प्रति पीई | 384KB प्रति पीई |
ऑन-चिप मेम | 128MB | 256MB |
ऑफ-चिप मेम | 64GB | 128GB |
ऑफ-चिप मेम बीडब्ल्यू | 176GB / s | 204GB / s |
कनेक्टिविटी | 8x PCIe Gen 4.0 - 16GB/s | 8x PCIe Gen 5.0 - 32GB/s |
तेदेपा | 25W | 90W |
* विरल प्रदर्शन. आप दोनों चिप्स का पूर्ण विवरण पा सकते हैं यहाँ उत्पन्न करें.
यह ध्यान दिया जाना चाहिए कि MTIA v2 वेब गोलियथ की GPUs की आवश्यकता को समाप्त नहीं करेगा। मेटा सुप्रीमो मार्क जुकरबर्ग पहले भी अपने मेगा-कॉर्पोरेशन की बात कह चुके हैं तैनात करेगा 350,000 एनवीडिया एच100 त्वरक और साल के अंत तक 600,000 एच100 के बराबर चालू हो जाएंगे।
इसके बजाय, एमटीआईए विशिष्ट कार्यों के अनुरूप कस्टम सिलिकॉन विकसित करने के लिए मेटा (और अन्य) के लिए एक तेजी से परिचित पैटर्न का पालन करता है। विचार यह है कि हालांकि किट सीपीयू और जीपीयू जितनी लचीली नहीं हो सकती है, लेकिन बड़े पैमाने पर तैनात होने पर एक एएसआईसी अधिक कुशल हो सकती है।
जबकि नवीनतम चिप अपने पूर्ववर्ती की तुलना में लगभग चार गुना अधिक बिजली की खपत करती है, यह फ़्लोटिंग पॉइंट प्रदर्शन को 7x तक उत्पन्न करने में सक्षम है। जीपीयू के मुकाबले, मेटा का नवीनतम त्वरक 7.8 TOPS प्रति वाट (TOPS/W) का प्रबंधन करता है, जो कि हम चर्चा की हमारे ब्लैकवेल कवरेज में, 100 TOPS/W पर Nvidia के H5.65 SXM को पीछे छोड़ देता है और 100 TOPS/W पर A3.12 SXM से दोगुने से भी अधिक है।
ऐसा कहने के बाद, यह स्पष्ट है कि मेटा ने अपने आंतरिक कार्यभार के अनुसार चिप को आकार देने के लिए काफी प्रयास किए हैं - अर्थात् अनुशंसित मॉडल पर अनुमान लगाना। इन्हें वैयक्तिकृत सुझाव प्रस्तुत करने के लिए डिज़ाइन किया गया है, जैसे कि जिन लोगों को आप जानते हैं या, अधिक महत्वपूर्ण रूप से मेटा के बिजनेस मॉडल के लिए, कौन से विज्ञापन आपके लिए सबसे अधिक प्रासंगिक हैं।
चिप्स को आवश्यकतानुसार स्केल करने के लिए भी डिज़ाइन किया गया है और कुल मिलाकर 72 त्वरक वाले रैक-आधारित सिस्टम में तैनात किया जा सकता है: प्रत्येक सिस्टम तीन चेसिस को जोड़ता है जिनमें से प्रत्येक में 12 कंप्यूट बोर्ड होते हैं और प्रति बोर्ड दो एमटीआईए वी2 चिप्स होते हैं।
प्रत्येक MTIA v2 चेसिस में 12 कंप्यूट बोर्ड होते हैं, जिनमें से प्रत्येक में त्वरक की एक जोड़ी होती है... बड़ा करने के लिए क्लिक करें। स्रोत: मेटा.
कार्यभार को तैनात करने के मामले में, मेटा PyTorch फ्रेमवर्क और ट्राइटन कंपाइलर पर बहुत अधिक निर्भर है। हमने इस संयोजन का उपयोग विभिन्न जीपीयू और एक्सेलेरेटर पर कार्य करने के लिए देखा है, आंशिक रूप से क्योंकि यह विशिष्ट हार्डवेयर के लिए अनुकूलित कोड विकसित करने की आवश्यकता को काफी हद तक समाप्त कर देता है।
मेटा, एक प्रमुख रहा है समर्थक PyTorch का, जिसे उसने लिनक्स फाउंडेशन को बागडोर सौंपने से पहले विकसित किया था, क्योंकि यह इंजीनियरों को एआई अनुप्रयोगों को विकसित करने की सुविधा देता है जो एनवीडिया और एएमडी से विभिन्न प्रकार के जीपीयू हार्डवेयर पर चल सकते हैं। तो यह समझ में आता है कि मेटा उन्हीं तकनीकों को अपने चिप्स के साथ नियोजित करना चाहेगा।
वास्तव में, मेटा का दावा है कि अपने सॉफ्टवेयर और हार्डवेयर को एक साथ विकसित करके वह मौजूदा जीपीयू प्लेटफार्मों की तुलना में अधिक दक्षता हासिल करने में सक्षम था और भविष्य के अनुकूलन के माध्यम से और भी अधिक प्रदर्शन हासिल करने की उम्मीद करता है।
MTIA v2 निश्चित रूप से मेटा से देखा जाने वाला आखिरी सिलिकॉन नहीं होगा। सोशल मीडिया दिग्गज का कहना है कि उसके पास कई चिप डिजाइन कार्यक्रम चल रहे हैं, जिनमें एक ऐसा भी है जो भविष्य के जेनरेटर एआई सिस्टम का समर्थन करेगा। ®
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://go.theregister.com/feed/www.theregister.com/2024/04/10/meta_mtia_chip/