जेफिरनेट लोगो

सहायक सहायक, रोमांटिक पार्टनर, या चोर कलाकार? भाग एक » सीसीसी ब्लॉग

दिनांक:

सीसीसी ने इस वर्ष के एएएएस वार्षिक सम्मेलन में तीन वैज्ञानिक सत्रों का समर्थन किया, और यदि आप व्यक्तिगत रूप से भाग लेने में सक्षम नहीं थे, तो हम प्रत्येक सत्र का पुनर्कथन करेंगे। इस सप्ताह, हम सत्र के पैनलिस्ट प्रस्तुतियों के मुख्य अंशों को संक्षेप में प्रस्तुत करेंगे, “बड़े भाषा मॉडल: सहायक सहायक, रोमांटिक पार्टनर या कॉन कलाकार?यह पैनल, द्वारा संचालित है डॉ. मारिया गिन्नी, सीसीसी काउंसिल के सदस्य और मिनेसोटा विश्वविद्यालय में कंप्यूटर विज्ञान और इंजीनियरिंग के प्रोफेसर, विशेष रुप से प्रदर्शित डॉ. ऐस कमर, माइक्रोसॉफ्ट रिसर्च में एआई फ्रंटियर्स के प्रबंध निदेशक, डॉ. हाल डौमे III, मैरीलैंड विश्वविद्यालय में कंप्यूटर विज्ञान के प्रोफेसर, और डॉ. जोनाथन मे, दक्षिणी कैलिफोर्निया विश्वविद्यालय सूचना विज्ञान संस्थान में कंप्यूटर विज्ञान के प्रोफेसर।

बड़े भाषा मॉडल आज समाज में बातचीत में सबसे आगे हैं, और यदि वे अपने आस-पास के प्रचार के अनुरूप जी रहे हैं तो जूरी इस पर ध्यान नहीं देती है। इस एएएएस सत्र के पैनलिस्टों ने एलएलएम की संभावनाओं, चुनौतियों और संभावनाओं को संबोधित किया।

पहले पैनलिस्ट डॉ. एसे कमर (माइक्रोसॉफ्ट रिसर्च) थे। उन्होंने एआई की वर्तमान स्थिति को "चरणीय परिवर्तन" के रूप में वर्णित किया। उन्होंने एक ऐसे व्यक्ति के रूप में एक अनूठा दृष्टिकोण प्रदान किया, जिसने उद्योग में एआई में बदलाव और गहन शिक्षण मॉडल में तेजी से वृद्धि देखी है, जिसकी बहुत कम लोगों को उम्मीद थी कि यह 2024 में भी जारी रहेगी।

यह वृद्धि उस डेटा की मात्रा में वृद्धि के कारण हुई जिस पर एलएलएम को प्रशिक्षित किया जाता है, और बड़े आर्किटेक्चर जिन्हें ट्रांसफार्मर कहा जाता है। ग्राफ़ पर डॉ. कमर द्वारा साझा की गई एक दिलचस्प जानकारी यह है कि मॉडल इतनी तेज़ी से बढ़ रहे हैं क्योंकि उन्हें शुरू में केवल एक विशेष कार्य के लिए प्रशिक्षित किया गया था; एक कार्य जो वे विश्वसनीय रूप से कर सकते थे। चैटजीपीटी ने दिखाया कि यदि आप पर्याप्त रूप से बड़े पैमाने पर स्केल करते हैं, जिसमें एक मॉडल को ध्यान में रखने वाले मापदंडों की संख्या भी शामिल है, तो मॉडल उस मॉडल के समान प्रदर्शन पर कार्य पूरा करना शुरू कर सकते हैं जिसे विशेष रूप से समान कार्यों को पूरा करने के लिए प्रशिक्षित किया गया था।

यह एलएलएम चरण संक्रमण की परिभाषा है: मॉडल को अब किसी विशिष्ट कार्य के लिए विशेष रूप से प्रशिक्षित करने की आवश्यकता नहीं है, लेकिन आम तौर पर प्रशिक्षित किया जा सकता है और फिर कई कार्य किए जा सकते हैं। और ऐसे कोई संकेत नहीं हैं कि इन क्षमताओं की वृद्धि धीमी हो रही है।

डॉ. कमर के पास GPT-4 तक शुरुआती पहुंच थी, और अपने व्यापक समय के परीक्षण के दौरान, वह पैमाने और डेटा के साथ आए इसके महत्वपूर्ण सुधारों से प्रभावित हुईं, और यह तथ्य कि यह एक साथ विभिन्न कार्यों को पूरा कर सकता है।

इन एलएलएम का भविष्य क्या है? डॉ. कमर का अनुमान है कि एलएलएम मानव भाषा से आगे बढ़कर मशीन भाषा सीखेंगे और दो भाषाओं के बीच अनुवाद करने में सक्षम होंगे। यह इनपुट और आउटपुट में तौर-तरीकों की क्षमताओं को बढ़ाएगा, जिससे मॉडल न केवल भाषा उत्पन्न करने में सक्षम हो सकते हैं, बल्कि व्यवहार में क्रियाएं और भविष्यवाणियां भी कर सकेंगे।

इसके बाद, डॉ. कमर ने कंप्यूटिंग में होने वाले महत्वपूर्ण चरण परिवर्तन पर विस्तार किया। आज सिस्टम बहुत अलग तरीके से विकसित किए जा रहे हैं, और इस विकास के लिए एक नए कंप्यूटिंग प्रतिमान बनाने की आवश्यकता होगी जिसे हमने इस समय केवल सतह पर ही देखा है। जिस तरह से हम कंप्यूटर के साथ इंटरैक्ट करते हैं वह आने वाले वर्षों में बहुत अलग दिखने वाला है, और इसके लिए मानव-कंप्यूटर इंटरेक्शन (एचसीआई) पर फिर से विचार करने की आवश्यकता होगी।

दूसरा बदलाव यह है कि इंसान किस तरह आगे बढ़कर काम करेगा। माइक्रोसॉफ्ट ने अध्ययन किया है कि एआई की सहायता से लिखे गए कोड की पंक्तियों के संदर्भ में श्रमिकों की उत्पादकता दोगुनी हो सकती है। यह एक अविश्वसनीय उपलब्धि है, लेकिन यह तकनीक कैसे काम करती है और इसकी बुद्धिमत्ता कहां से आती है यह काफी हद तक अज्ञात है, इसलिए इस क्षेत्र में बहुत सारे शोध प्रश्न हैं।

इस तरह के एलएलएम के संभावित दुरुपयोग के बारे में भी बहुत सारे प्रश्न हैं। निष्पक्षता, विभिन्न जनसांख्यिकीय जोखिमों और अन्य और भी अधिक कठोर परिणामों को लेकर चिंताएँ हैं। जहां वैज्ञानिक खोज की काफी संभावनाएं हैं, वहीं नुकसान की भी काफी संभावनाएं हैं; उदाहरण के लिए, माता-पिता को अपने बच्चों को टीका न लगवाने के लिए समझाना, किसी बच्चे को कुछ बुरा करने के लिए मनाना, या किसी को यह समझाना कि दुनिया सपाट है। एलएलएम के विकास में बहुत सारे सुरक्षा प्रयास किए गए हैं, और इस क्षेत्र में भी प्रगति करने के लिए ओपन सोर्सिंग बहुत मददगार हो सकती है।  

इसके बाद डॉ. कमर ने वैज्ञानिक समुदाय से प्रश्न पूछे:

  • एआई व्यवधान से विज्ञान कैसे बदलेगा?
  • क्या हम अगली पीढ़ी को शिक्षित और प्रशिक्षित करने के तरीके में बदलाव लाने के लिए कदम उठा रहे हैं?
  • क्या आप इस चरण परिवर्तन से लाभ उठाने के लिए तकनीकी बुनियादी ढांचे का निर्माण कर रहे हैं?
  • क्या हम भावी पीढ़ियों को नई दुनिया के लिए तैयार कर रहे हैं?

अंत में, डॉ. कमर ने इस बात पर जोर दिया कि चरण परिवर्तन के मुख्य पहलुओं में से एक जो उल्लेखनीय है वह वह गति है जिसमें एलएलएम विकसित हो रहे हैं। ये मॉडल बहुत ही कम समय में महत्वपूर्ण रूप से सुधार कर रहे हैं, और कंप्यूटिंग शोधकर्ताओं को बहुत कुछ करना बाकी है।

दूसरे पैनलिस्ट, डॉ. हैल ड्यूमे III (मैरीलैंड विश्वविद्यालय) ने अपनी बात यह समझाते हुए शुरू की कि लोगों को वे काम करने में मदद करने के लिए एआई मॉडल विकसित किए जाने चाहिए जो वे करना चाहते हैं; मानवीय कार्य को बढ़ाएं, स्वचालित नहीं। स्वचालन की यह दृष्टि 60 के दशक से समाज में व्याप्त है। लोगों को बेहतर शतरंज खेलने में मदद करने के बजाय, वैज्ञानिकों ने एक ऐसी प्रणाली तैयार की जो शतरंज को अपने आप खेलती है।

यह दर्शन कहीं नहीं जा रहा है; एक बार जब एआई किसी कार्य को स्वयं करने के लिए पर्याप्त बुद्धिमान हो जाए तो वह आज भी समाचार योग्य है। यह एआई के खून में गहरा है। किसी सिस्टम को स्वचालित करने पर समय और पैसा खर्च करने से पहले, हमें रुककर पूछना चाहिए कि क्या यह हमारे हित में है?

डॉ. ड्यूमे ने संवर्द्धन की अवधारणा को आगे बढ़ाया: एआई को एक उपकरण के रूप में कैसे इस्तेमाल किया जा सकता है? जीथब कोपायलट जैसे सिस्टम उत्पादकता बढ़ाते हैं, लेकिन उत्पादकता बढ़ाना पर्याप्त नहीं है। सिस्टम के एक उपयोगकर्ता ने कहा कि इससे उन्हें कोडिंग के उन हिस्सों पर ध्यान केंद्रित करने का मौका मिला जो मज़ेदार थे, जो कि एआई का निर्माण कैसे किया जाना चाहिए, इसके अनुरूप है।

एआई शोधकर्ताओं को किसी व्यक्ति के काम के उन हिस्सों को नहीं हटाना चाहिए जो मज़ेदार हैं; उन्हें कठिन परिश्रम को दूर करने को प्राथमिकता देनी चाहिए। इससे किसी कंपनी के मुनाफे में सुधार के बजाय मानव जीवन में सुधार होना चाहिए।

डॉ. ड्यूमे ने इन बिंदुओं को उठाते हुए एक पेपर का सह-लेखन किया, और प्रतिवाद यह उभरा कि तकनीकी दृष्टिकोण से, विशेष रूप से मशीन लर्निंग तकनीक का उपयोग करके सिस्टम बनाना अक्सर बढ़ाने की तुलना में स्वचालित करना बहुत आसान होता है। ऐसा इसलिए है क्योंकि किसी सिस्टम को प्रशिक्षित करने के लिए आवश्यक डेटा जो किसी सिस्टम को प्रशिक्षित करेगा, आसानी से मिल जाता है। हम अपना काम करके यह जानकारी प्रदान करते हैं, और मानव व्यवहार का अनुकरण करने के लिए एमएल को प्रशिक्षित करना आसान है। किसी कार्य को पूरा करने में किसी की मदद करने वाली प्रणाली को सिखाना बहुत कठिन है। यह जानकारी एनएसएफ की साहित्य समीक्षाओं, प्रोग्रामर द्वारा कागज के टुकड़े पर लिखने आदि के बीच बिखरी हुई है। मानव को कार्य करने में मदद करने के लिए आवश्यक डेटा रिकॉर्ड नहीं किया जाता है।

सहायक प्रणालियों के निर्माण का एक अन्य महत्वपूर्ण पहलू उपयोगकर्ता से यह पूछना है कि कौन सी प्रणालियाँ उनके जीवन के लिए सहायक होंगी। उदाहरण के लिए, अंधे लोगों की ज़रूरतें दृष्टिहीन लोगों की ज़रूरतों से बहुत अलग होती हैं (जो कि दृष्टिहीन लोगों से भी भिन्न होती हैं) सोचना अंधे लोगों की जरूरतें हैं)। डॉ. ड्यूमे ने एक उदाहरण साझा किया कि एक दृश्य प्रणाली यह बता सकती है कि कोई वस्तु सोडा का एक कैन है, लेकिन एक अंधा व्यक्ति आमतौर पर इसे स्वयं ही बता सकता है। सोडा के तत्व उनके लिए अधिक उपयोगी होंगे। प्रश्नों को समझने और सुलभता संबंधी प्रश्नों को संबोधित करने के लिए सिस्टम की प्रतिक्रियाओं की गुणवत्ता के बीच एक बड़ा अंतर है, और यह अंतर बढ़ता जा रहा है।

समुदाय की "मदद" करने के लिए प्रौद्योगिकी बनाने से पहले उनकी ज़रूरतों को निर्धारित करने के महत्व का एक अतिरिक्त उदाहरण सामग्री मॉडरेशन है। कई स्वयंसेवी सामग्री मॉडरेटर इस काम में संलग्न हैं क्योंकि वे दुनिया को एक बेहतर जगह बनाना चाहते हैं, और एक समुदाय बनाने में मदद करना चाहते हैं जो उन्हें महत्वपूर्ण लगता है। जब उनसे पूछा गया कि वे अपनी भूमिका में सहायता के लिए किस प्रकार का टूल चाहते हैं, तो वे अक्सर नहीं चाहते कि उनका काम पूरी तरह से स्वचालित हो, वे बस चैट इतिहास को देखने जैसे उबाऊ हिस्सों को आसान बनाना चाहते हैं।

डॉ. ड्यूमे इस चर्चा को अपनी कार-प्रेमी माँ के अंतिम उदाहरण के साथ समाप्त करते हैं जो कारों से प्यार करती है, और स्वचालित कारों को चलाने से इनकार करती है। वह मैनुअल ट्रांसमिशन चुनती है, और उसके लिए यह विकल्प चुनना वास्तव में महत्वपूर्ण है। लोगों को इस पर नियंत्रण होना चाहिए कि वे चाहते हैं कि उनके कार्य स्वचालित हों या नहीं।

डॉ. ड्यूमे ने सुगम्यता प्रौद्योगिकी के वर्तमान दृष्टिकोणों के विकल्पों की पेशकश करके बातचीत जारी रखी है। उदाहरण के लिए, सांकेतिक भाषा पहचान के लिए एक उपकरण बनाते समय, हस्ताक्षर करने वाले लोगों के वीडियो के लिए इंटरनेट को खंगालने के बजाय (जिसमें बहुत अधिक सहमति और गोपनीयता संबंधी चिंताएँ होती हैं, साथ ही इनमें से अधिकांश वीडियो पेशेवरों के होते हैं और पृष्ठभूमि शोर/विकर्षण के बिना होते हैं जो कि ' यथार्थवादी), समुदाय तक पहुंचें और एक परियोजना शुरू करें जो उन्हें टूल को प्रशिक्षित करने के लिए वीडियो सबमिट करने के लिए सशक्त बनाती है। इस तरह की समुदाय-प्रथम रणनीतियाँ अधिक नैतिक और जिम्मेदार हैं, और उपयोगकर्ताओं को अधिक नियंत्रण प्रदान करती हैं। 

एलएलएम और अन्य उपकरणों को उपयोगिता को प्राथमिकता देने के लिए विकसित किया जाना चाहिए, बुद्धिमत्ता को नहीं, डॉ. ड्यूमे ने निष्कर्ष निकाला। यह जितना अधिक उपयोगी है, उतना ही अधिक यह लोगों को कुछ ऐसा करने में मदद कर सकता है जो वे नहीं कर सकते हैं या नहीं करना चाहते हैं, बजाय इसके कि किसी ऐसी चीज़ को स्वचालित किया जाए जिसे लोग पहले से ही अच्छा कर रहे हैं और आनंद ले रहे हैं।

डॉ. जोनाथन मे (दक्षिणी कैलिफोर्निया सूचना विज्ञान संस्थान विश्वविद्यालय) अगले वक्ता थे, और उन्होंने सम्मेलन के विषय: "टुवार्ड्स विदाउट साइंस विदाउट वॉल्स" पर विचार करते हुए अपनी बात शुरू की। उनका मानना ​​है कि जहां हालिया एलएलएम विकास कुछ लोगों के लिए दीवारें गिरा रहा है, वहीं यह कई लोगों के लिए दीवारें खड़ी कर रहा है।

वह सबसे पहले चर्चा करते हैं कि कैसे इंटरनेट ने अनुसंधान करने के लिए कई बाधाओं को कम किया; जब वह 17 वर्ष के थे तो उन्हें आश्चर्य हुआ कि स्टार वार्स और लॉर्ड ऑफ द रिंग्स के कथानक एक जैसे क्यों थे, और उन्हें लाइब्रेरी में जाना पड़ा और उत्तर के साथ एक किताब ढूंढनी पड़ी। उन्होंने अपनी पीएचडी थीसिस के लिए बहुत अधिक प्रयास किए लेकिन उतना ही कठिन शोध भी किया, लेकिन उनके अध्ययन के समय के अंत तक इस विषय पर एक विकिपीडिया पेज बनाया गया, और फिर इंटरनेट खोज, और अब कार-रहित शोध आदर्श है।

डॉ. मे ने यह कहते हुए आगे कहा कि उन्हें एलएलएम के लक्षित दर्शकों की जनसांख्यिकीय सूची में शामिल होने का सौभाग्य प्राप्त हुआ है। वह अक्सर कोड नहीं करता है और उसने कभी भी बहुत सारे कोडिंग कौशल नहीं सीखे हैं, लेकिन जब उसे अपने काम के लिए इसकी आवश्यकता होती है तो वह ChatGPT से पूछ सकता है और यह बहुत अच्छा काम करता है। 

हालाँकि, एलएलएम की उपयोगिता को व्यापक बनाने में कई बाधाएँ हैं:

  • भाषा की दीवारें: मॉडल जितने अधिक डेटा पर प्रशिक्षित होते हैं, वे उतना ही बेहतर काम करते हैं। हालाँकि आज के व्यावसायिक एलएलएम बहुभाषी हैं, लेकिन उनमें अंग्रेजी का अधिक महत्व है। उदाहरण के लिए, ChatGPT 92% अंग्रेजी भाषा पर प्रशिक्षित है। इसके अलावा, निर्देश डेटा, जो एलएलएम का "गुप्त सॉस" है, विशाल बहुमत अंग्रेजी है (उदाहरण के लिए चैटजीपीटी का 96%)। मौजूदा परीक्षणों पर प्रणालीगत प्रदर्शन अंतराल के बावजूद इन मॉडलों के क्रॉस-लिंगुअल प्रदर्शन में सुधार के लिए वर्तमान में बहुत कम प्रयास हैं, जो एक आम सहमति के कारण समझ में आता है कि मशीन अनुवाद (एमटी) "हल" हो गया है और प्रयासों को अन्य कार्यों पर केंद्रित किया जाना चाहिए।
  • पहचान की दीवारें: यदि आप चैटजीपीटी से पूछते हैं कि आपको क्रिसमस पर क्या करना चाहिए, तो यह विभिन्न गतिविधियों और परंपराओं पर ध्यान केंद्रित करता है जिनमें आप शामिल हो सकते हैं; इसमें यह उल्लेख नहीं है कि आप काम पर जा सकते हैं। विभिन्न जनसांख्यिकीय समूहों का वर्णन करते समय एलएलएम को अलग-अलग व्यवहार करते हुए दिखाया गया है, कुछ मामलों में अधिक नकारात्मक भावना और यहां तक ​​कि पूरी तरह से विषाक्तता भी व्यक्त की गई है। रूढ़िवादी वाक्यों की संभावनाएँ हैं जो LGBTQ+ या यहूदी जैसे समुदायों में नुकसान पहुंचा सकते हैं; बोर्ड भर में बहुत अधिक पूर्वाग्रह है और इसका परिणाम विस्तृत निर्णय लेने में होता है। इसमें कुछ सुरक्षा उपाय अंतर्निहित हैं, और अधिक स्पष्ट जांच वाले प्रश्नों से जहरीले उत्तर मिलने की संभावना कम होती है, लेकिन मॉडल संभावित रूप से रूढ़िवादी बयानों और परिणामों को पसंद करते हैं, और यही वह जगह है जहां विशेष रूप से डाउनस्ट्रीम क्षमताओं में मॉडल का उपयोग करते समय नुकसान होता है जहां आप नहीं देखते हैं आउटपुट (यानी ऋण पात्रता)। उन्होंने एलएलएम का एक उदाहरण दिया जो अपनी नौकरी के आधार पर व्यक्तियों के चेहरे तैयार करते समय पूर्वाग्रह दिखाता है; कम वेतन वाली नौकरियों में महिलाओं और अल्पसंख्यकों को दिखाया गया है, जबकि अधिक भुगतान वाली नौकरियों में श्वेत पुरुषों को दिखाया गया है।
  • पर्यावरण दीवारें (सॉफ्टवेयर): एलएलएम को उत्पादन और चलाने के लिए महत्वपूर्ण मात्रा में ऊर्जा की आवश्यकता होती है। यहां तक ​​कि सबसे "मामूली" एलएम भी एक व्यक्ति के उपयोग की तुलना में 3 गुना अधिक वार्षिक ऊर्जा का उपयोग करते हैं। चैटजीपीटी जैसे सबसे बड़े भाषा मॉडल के लिए डेटा में भी एक महत्वपूर्ण अंतर है, लेकिन जो कंपनियां उनके मालिक हैं वे स्पष्ट रूप से अपनी ऊर्जा खपत तक पहुंच से इनकार करते हैं।
  • पर्यावरणीय दीवारें (हार्डवेयर): चिप्स का उत्पादन करने के लिए, जिसकी सभी एलएलएम को आवश्यकता होती है, आपको टैंटलम (कांगो में खनन), और हेफ़नियम (सेनेगल और रूस में खनन) जैसी "संघर्ष सामग्री" की आवश्यकता होती है। अमेरिका में, कंपनियों को उनके द्वारा उपयोग किए जाने वाले संघर्षशील खनिजों की मात्रा की रिपोर्ट करनी होती है, लेकिन अमेरिका सार्वजनिक रूप से इन सामग्रियों के उपयोग में कमी दिखा रहा है, जो सच नहीं हो सकता है। इसके अलावा, कई सामाजिक-राजनीतिक समस्याएं भी हैं जैसे चीन द्वारा अमेरिकी निर्यात प्रतिबंधों के प्रतिशोध में जर्मेनियम और गैलियम पर प्रतिबंध लगाना।

डॉ. मे ने व्यक्त किया कि ये श्रेणियां एलएलएम से होने वाले नुकसान के कई डाउनस्ट्रीम मुद्दों में से कुछ को प्रकट करती हैं, और ऐसे उदाहरण भी हैं जहां लोगों को लाभ नहीं हो रहा है। चिंता का कारण है, लेकिन अनुसंधान और/या व्यवहार परिवर्तन के अवसर भी हैं जो इनमें से कुछ नुकसान को कम कर सकते हैं:

  • भाषा: बहुभाषिकता के लिए अधिक शोध निधि समर्पित करें (सिर्फ अंग्रेजी से और अंग्रेजी में आधिपत्य अनुवाद नहीं)।
  • पहचान: नीचे से ऊपर और समुदाय-समावेशी अनुसंधान। तैनाती से पहले मॉडल संशोधन और परीक्षण
  • पर्यावरण: एल्गोरिदम विकास जो कम डेटा का उपयोग करता है और कम मापदंडों को बदलता है (उदाहरण के लिए लोआरए, एडेप्टर, गैर-आरएल पीओ)। गणना के प्रति ईमानदार रहें और नियामक स्तरों पर खुलेपन पर जोर दें 

डॉ. मे ने डॉ. ड्यूमे की बात को दोहराते हुए पैनल को समाप्त किया कि एलएलएम के साथ बातचीत करते समय लोगों को उसी तरह से लाभान्वित किया जाना चाहिए जिस तरह से वे लाभान्वित होना चाहते हैं, और विकास के स्तर पर इसे सबसे ऊपर रखने की आवश्यकता है।

पढ़ने के लिए आपका बहुत-बहुत धन्यवाद, और कृपया सत्र के प्रश्नोत्तर भाग का सारांश पढ़ने के लिए कल जुड़ें।

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी