जेफिरनेट लोगो

AlphaTensor के साथ उपन्यास एल्गोरिदम की खोज

दिनांक:

गणित के लिए अल्फ़ाज़ीरो का पहला विस्तार अनुसंधान के लिए नई संभावनाओं को खोलता है

एल्गोरिदम ने गणितज्ञों को हजारों वर्षों से मौलिक संचालन करने में मदद की है। प्राचीन मिस्रवासियों ने एक गुणन तालिका की आवश्यकता के बिना दो संख्याओं को गुणा करने के लिए एक एल्गोरिथ्म बनाया, और ग्रीक गणितज्ञ यूक्लिड ने सबसे बड़े सामान्य भाजक की गणना करने के लिए एक एल्गोरिथ्म का वर्णन किया, जो आज भी उपयोग में है। 

इस्लामी स्वर्ण युग के दौरान, फारसी गणितज्ञ मुहम्मद इब्न मूसा अल-ख्वारिज्मी रैखिक और द्विघात समीकरणों को हल करने के लिए नए एल्गोरिदम तैयार किए। वास्तव में, अल-ख्वारिज्मी का नाम, लैटिन में अनुवादित as एल्गोरिदम, एल्गोरिथ्म शब्द का नेतृत्व किया। लेकिन, आज एल्गोरिदम के साथ परिचित होने के बावजूद - कक्षा के बीजगणित से लेकर अत्याधुनिक वैज्ञानिक अनुसंधान तक पूरे समाज में उपयोग किया जाता है - नए एल्गोरिदम की खोज की प्रक्रिया अविश्वसनीय रूप से कठिन है, और मानव मन की अद्भुत तर्क क्षमताओं का एक उदाहरण है। 

हमारे में काग़ज़, नेचर . में आज प्रकाशित, हम परिचय देते हैं अल्फा टेंसर, मैट्रिक्स गुणन जैसे मौलिक कार्यों के लिए उपन्यास, कुशल और सिद्ध रूप से सही एल्गोरिदम की खोज के लिए पहली कृत्रिम बुद्धि (एआई) प्रणाली। यह गणित में दो आव्यूहों को गुणा करने का सबसे तेज़ तरीका खोजने के बारे में 50 साल पुराने खुले प्रश्न पर प्रकाश डालता है।

यह पेपर डीपमाइंड के विज्ञान को आगे बढ़ाने और एआई का उपयोग करके सबसे बुनियादी समस्याओं को अनलॉक करने के मिशन में एक कदम है। हमारा सिस्टम, AlphaTensor, AlphaZero पर निर्मित होता है, जो एक एजेंट है शतरंज, गो और शोगी जैसे बोर्ड खेलों में अलौकिक प्रदर्शन दिखाया गया है, और यह काम पहली बार गेम खेलने से लेकर अनसुलझी गणितीय समस्याओं से निपटने के लिए अल्फाज़ेरो की यात्रा को दर्शाता है। 

मैट्रिक्स गुणन

मैट्रिक्स गुणन बीजगणित में सबसे सरल कार्यों में से एक है, जिसे आमतौर पर हाई स्कूल गणित की कक्षाओं में पढ़ाया जाता है। लेकिन कक्षा के बाहर, इस विनम्र गणितीय ऑपरेशन का समकालीन डिजिटल दुनिया में बहुत प्रभाव है और यह आधुनिक कंप्यूटिंग में सर्वव्यापी है। 

दो 3×3 मैट्रिक्स को गुणा करने की प्रक्रिया का उदाहरण।

इस ऑपरेशन का उपयोग स्मार्टफोन पर छवियों को संसाधित करने, भाषण आदेशों को पहचानने, कंप्यूटर गेम के लिए ग्राफिक्स बनाने, मौसम की भविष्यवाणी करने के लिए सिमुलेशन चलाने, इंटरनेट पर साझा करने के लिए डेटा और वीडियो को संपीड़ित करने और बहुत कुछ करने के लिए किया जाता है। दुनिया भर की कंपनियां मैट्रिस को कुशलता से गुणा करने के लिए कंप्यूटिंग हार्डवेयर विकसित करने में बड़ी मात्रा में समय और पैसा खर्च करती हैं। इसलिए, मैट्रिक्स गुणन की दक्षता में मामूली सुधार भी व्यापक प्रभाव डाल सकता है।

सदियों से, गणितज्ञ मानते थे कि दक्षता के मामले में मानक मैट्रिक्स गुणन एल्गोरिथ्म सबसे अच्छा प्राप्त कर सकता है। लेकिन 1969 में जर्मन गणितज्ञ वोल्केन स्ट्रैसेन ने गणितीय समुदाय को चौंका दिया यह दिखाकर कि बेहतर एल्गोरिदम मौजूद हैं।

स्ट्रैसन के एल्गोरिथ्म की तुलना में मानक एल्गोरिथ्म, जो 7×8 मैट्रिसेस को गुणा करने के लिए एक कम अदिश गुणन (आठ के बजाय 2) का उपयोग करता है। गुणन समग्र दक्षता के लिए परिवर्धन की तुलना में बहुत अधिक मायने रखता है।

बहुत छोटे मैट्रिसेस (आकार 2×2) का अध्ययन करके, उन्होंने एक तेज़ एल्गोरिथम प्राप्त करने के लिए मैट्रिसेस की प्रविष्टियों को संयोजित करने का एक सरल तरीका खोजा। स्ट्रैसेन की सफलता के बाद दशकों के शोध के बावजूद, इस समस्या के बड़े संस्करण अनसुलझे रह गए हैं - इस हद तक कि यह ज्ञात नहीं है कि दो मैट्रिक्स को 3×3 जितना छोटा गुणा करना कितनी कुशलता से संभव है। 

हमारे पेपर में, हमने पता लगाया कि आधुनिक एआई तकनीक नए मैट्रिक्स गुणन एल्गोरिदम की स्वचालित खोज को कैसे आगे बढ़ा सकती है। मानव अंतर्ज्ञान की प्रगति पर निर्माण करते हुए, AlphaTensor ने ऐसे एल्गोरिदम की खोज की जो कई मैट्रिक्स आकारों के लिए अत्याधुनिक से अधिक कुशल हैं। हमारे एआई-डिज़ाइन किए गए एल्गोरिदम मानव-डिज़ाइन किए गए एल्गोरिदम से बेहतर प्रदर्शन करते हैं, जो एल्गोरिथम खोज के क्षेत्र में एक बड़ा कदम है। 

एल्गोरिथम खोज को स्वचालित करने की प्रक्रिया और प्रगति

सबसे पहले, हमने मैट्रिक्स गुणन के लिए कुशल एल्गोरिदम खोजने की समस्या को एकल-खिलाड़ी गेम में बदल दिया। इस गेम में, बोर्ड एक त्रि-आयामी टेंसर (संख्याओं की सरणी) है, यह कैप्चर करता है कि वर्तमान एल्गोरिथम सही से कितनी दूर है। एल्गोरिथम निर्देशों के अनुरूप अनुमत चालों के एक सेट के माध्यम से, खिलाड़ी टेंसर को संशोधित करने और उसकी प्रविष्टियों को शून्य करने का प्रयास करता है। जब खिलाड़ी ऐसा करने का प्रबंधन करता है, तो इसका परिणाम किसी भी जोड़ी मैट्रिसेस के लिए एक सही ढंग से सही मैट्रिक्स गुणन एल्गोरिथ्म में होता है, और इसकी दक्षता टेंसर को शून्य करने के लिए उठाए गए कदमों की संख्या से कैप्चर की जाती है।

यह गेम अविश्वसनीय रूप से चुनौतीपूर्ण है - विचार करने के लिए संभावित एल्गोरिदम की संख्या ब्रह्मांड में परमाणुओं की संख्या से कहीं अधिक है, यहां तक ​​कि मैट्रिक्स गुणन के छोटे मामलों के लिए भी। गो के खेल की तुलना में, जो बना रहा दशकों से एआई के लिए एक चुनौती, हमारे खेल के प्रत्येक चरण में संभावित चालों की संख्या अधिक परिमाण के 30 आदेश (10 . से ऊपर) है33 हम जिन सेटिंग्स पर विचार करते हैं उनमें से एक के लिए)।

अनिवार्य रूप से, इस खेल को अच्छी तरह से खेलने के लिए, संभावनाओं के विशाल ढेर में सबसे छोटी सुइयों की पहचान करने की आवश्यकता है। इस डोमेन की चुनौतियों से निपटने के लिए, जो पारंपरिक खेलों से काफी अलग है, हमने एक उपन्यास तंत्रिका नेटवर्क वास्तुकला सहित कई महत्वपूर्ण घटक विकसित किए हैं जिसमें समस्या-विशिष्ट आगमनात्मक पूर्वाग्रह, उपयोगी सिंथेटिक डेटा उत्पन्न करने की प्रक्रिया और समरूपता का लाभ उठाने के लिए एक नुस्खा शामिल है। संकट।

फिर हमने मौजूदा मैट्रिक्स गुणन एल्गोरिदम के बारे में किसी भी ज्ञान के बिना, खेल खेलने के लिए सुदृढीकरण सीखने का उपयोग करके एक अल्फाटेन्सर एजेंट को प्रशिक्षित किया। सीखने के माध्यम से, अल्फा टेंसर धीरे-धीरे समय के साथ सुधार करता है, ऐतिहासिक फास्ट मैट्रिक्स गुणन एल्गोरिदम जैसे स्ट्रैसन की फिर से खोज करता है, अंततः मानव अंतर्ज्ञान के दायरे को पार करता है और पहले से ज्ञात एल्गोरिदम की खोज करता है।

अल्फाटेन्सर द्वारा खेला जाने वाला सिंगल-प्लेयर गेम, जहां लक्ष्य एक सही मैट्रिक्स गुणन एल्गोरिथ्म खोजना है। खेल की स्थिति संख्याओं की एक घन सरणी है (0 के लिए ग्रे के रूप में दिखाया गया है, 1 के लिए नीला और -1 के लिए हरा), शेष कार्य का प्रतिनिधित्व करता है।

उदाहरण के लिए, यदि स्कूल में पढ़ाया जाने वाला पारंपरिक एल्गोरिथम 4 गुणा का उपयोग करके 5×5 को 5×100 मैट्रिक्स से गुणा करता है, और यह संख्या मानव सरलता के साथ घटाकर 80 कर दी गई है, तो AlphaTensor ने एल्गोरिदम पाया है जो केवल 76 गुणाओं का उपयोग करके समान ऑपरेशन करते हैं। 

अल्फ़ाटेन्सर द्वारा 76 गुणाओं का उपयोग करके एल्गोरिदम की खोज की गई, जो अत्याधुनिक एल्गोरिदम में सुधार है।

इस उदाहरण से परे, अल्फाटेन्सर का एल्गोरिथ्म 50 साल पहले इसकी खोज के बाद पहली बार एक परिमित क्षेत्र में स्ट्रैसेन के दो-स्तरीय एल्गोरिथ्म में सुधार करता है। छोटे मेट्रिसेस को गुणा करने के लिए इन एल्गोरिदम का उपयोग आदिम के रूप में मनमाने आकार के बहुत बड़े मैट्रिस को गुणा करने के लिए किया जा सकता है। 

इसके अलावा, AlphaTensor अत्याधुनिक जटिलता के साथ एल्गोरिदम के एक विविध सेट की खोज करता है - प्रत्येक आकार के लिए हजारों मैट्रिक्स गुणन एल्गोरिदम तक, यह दर्शाता है कि मैट्रिक्स गुणन एल्गोरिदम का स्थान पहले की तुलना में अधिक समृद्ध है। 

इस समृद्ध स्थान के एल्गोरिदम में विभिन्न गणितीय और व्यावहारिक गुण हैं। इस विविधता का लाभ उठाते हुए, हमने विशेष रूप से एल्गोरिथम खोजने के लिए अल्फाटेन्सर को अनुकूलित किया, जो किसी दिए गए हार्डवेयर पर तेज़ हैं, जैसे कि एनवीडिया वी 100 जीपीयू, और गूगल टीपीयू v2. ये एल्गोरिदम समान हार्डवेयर पर आमतौर पर उपयोग किए जाने वाले एल्गोरिदम की तुलना में बड़े मैट्रिक्स को 10-20% तेजी से गुणा करते हैं, जो मनमाने उद्देश्यों को अनुकूलित करने में अल्फाटेन्सर के लचीलेपन को प्रदर्शित करता है।

AlphaTensor एल्गोरिथ्म के रनटाइम के अनुरूप एक उद्देश्य के साथ। जब एक सही मैट्रिक्स गुणन एल्गोरिथ्म की खोज की जाती है, तो इसे लक्ष्य हार्डवेयर पर बेंचमार्क किया जाता है, जिसे फिर लक्ष्य हार्डवेयर पर अधिक कुशल एल्गोरिदम सीखने के लिए अल्फाटेन्सर को वापस फीड किया जाता है।

भविष्य के अनुसंधान और अनुप्रयोगों पर प्रभाव की खोज

गणितीय दृष्टिकोण से, हमारे परिणाम जटिलता सिद्धांत में आगे के शोध का मार्गदर्शन कर सकते हैं, जिसका उद्देश्य कम्प्यूटेशनल समस्याओं को हल करने के लिए सबसे तेज़ एल्गोरिदम निर्धारित करना है। पिछले दृष्टिकोणों की तुलना में अधिक प्रभावी तरीके से संभावित एल्गोरिदम के स्थान की खोज करके, AlphaTensor मैट्रिक्स गुणन एल्गोरिदम की समृद्धि के बारे में हमारी समझ को आगे बढ़ाने में मदद करता है। मैट्रिक्स गुणन की स्पर्शोन्मुख जटिलता को निर्धारित करने में मदद करने के लिए इस स्थान को समझने से नए परिणाम मिल सकते हैं, कंप्यूटर विज्ञान में सबसे मौलिक खुली समस्याओं में से एक

क्योंकि मैट्रिक्स गुणन कई कम्प्यूटेशनल कार्यों में एक मुख्य घटक है, जिसमें कंप्यूटर ग्राफिक्स, डिजिटल संचार, तंत्रिका नेटवर्क प्रशिक्षण और वैज्ञानिक कंप्यूटिंग शामिल हैं, अल्फाटेन्सर द्वारा खोजे गए एल्गोरिदम इन क्षेत्रों में गणना को काफी अधिक कुशल बना सकते हैं। किसी भी प्रकार के उद्देश्य पर विचार करने के लिए AlphaTensor का लचीलापन भी एल्गोरिदम को डिजाइन करने के लिए नए अनुप्रयोगों को प्रेरित कर सकता है जो कि ऊर्जा के उपयोग और संख्यात्मक स्थिरता जैसे मैट्रिक्स को अनुकूलित करते हैं, स्नोबॉलिंग से छोटी गोल त्रुटियों को रोकने में मदद करते हैं क्योंकि एल्गोरिदम काम करता है।

जबकि हमने यहां मैट्रिक्स गुणन की विशेष समस्या पर ध्यान केंद्रित किया है, हम आशा करते हैं कि हमारा पेपर अन्य मौलिक कम्प्यूटेशनल कार्यों के लिए एल्गोरिथम खोज का मार्गदर्शन करने के लिए एआई का उपयोग करने के लिए दूसरों को प्रेरित करेगा। हमारे शोध से यह भी पता चलता है कि AlphaZero एक शक्तिशाली एल्गोरिथम है जिसे गणित में खुली समस्याओं को हल करने में मदद करने के लिए पारंपरिक खेलों के क्षेत्र से काफी आगे बढ़ाया जा सकता है। अपने शोध के आधार पर, हम काम के एक बड़े निकाय पर काम करने की उम्मीद करते हैं - एआई को लागू करने से समाज को गणित और विज्ञान में कुछ सबसे महत्वपूर्ण चुनौतियों का समाधान करने में मदद मिलती है।

स्पॉट_आईएमजी

नवीनतम खुफिया

वीसी कैफे

वीसी कैफे

स्पॉट_आईएमजी