जेफिरनेट लोगो

2024 में सबसे महत्वपूर्ण एआई रुझान - आईबीएम ब्लॉग

दिनांक:


2024 में सबसे महत्वपूर्ण एआई रुझान - आईबीएम ब्लॉग



सफलता के लिए अपनी योजना के अनुसार अपनी टीम को निर्देशित करना

2022 वह वर्ष था जब जनरेटिव आर्टिफिशियल इंटेलिजेंस (एआई) सार्वजनिक चेतना में विस्फोटित हुआ, और 2023 वह वर्ष था जब इसने व्यापार जगत में जड़ें जमानी शुरू कीं। इस प्रकार 2024 एआई के भविष्य के लिए एक महत्वपूर्ण वर्ष है, क्योंकि शोधकर्ता और उद्यम यह स्थापित करना चाहते हैं कि प्रौद्योगिकी में इस विकासवादी छलांग को हमारे रोजमर्रा के जीवन में कैसे व्यावहारिक रूप से एकीकृत किया जा सकता है।

जेनेरिक एआई के विकास ने कंप्यूटर के विकास को प्रतिबिंबित किया है, यद्यपि नाटकीय रूप से त्वरित समयरेखा पर। कुछ खिलाड़ियों के विशाल, केंद्र संचालित मेनफ्रेम कंप्यूटरों ने उद्यमों और अनुसंधान संस्थानों के लिए सुलभ छोटी, अधिक कुशल मशीनों का मार्ग प्रशस्त किया। इसके बाद के दशकों में, क्रमिक प्रगति से घरेलू कंप्यूटर उपलब्ध हुए जिनके साथ शौकिया लोग छेड़छाड़ कर सकते थे। समय के साथ, सहज नो-कोड इंटरफेस वाले शक्तिशाली पर्सनल कंप्यूटर सर्वव्यापी हो गए।

जेनरेटिव एआई पहले ही अपने "शौकियावादी" चरण में पहुंच चुका है - और कंप्यूटर की तरह, आगे की प्रगति का लक्ष्य छोटे पैकेजों में अधिक प्रदर्शन प्राप्त करना है। 2023 में तेजी से कार्यकुशलता का विस्फोट देखा गया नींव मॉडल खुले लाइसेंस के साथ, मेटा के बड़े भाषा मॉडल (एलएलएम) के लामा परिवार के लॉन्च के साथ शुरुआत हुई और उसके बाद स्टेबलएलएम, फाल्कन, मिस्ट्रल और जैसे मॉडल आए। लामा 2. डीपफ्लोयड और स्टेबल डिफ्यूजन ने प्रमुख मालिकाना मॉडल के साथ सापेक्ष समानता हासिल की है। ओपन सोर्स समुदाय द्वारा विकसित फाइन-ट्यूनिंग तकनीकों और डेटासेट के साथ उन्नत, कई ओपन मॉडल अब छोटे पैरामीटर गणना के बावजूद, अधिकांश बेंचमार्क पर सबसे शक्तिशाली बंद-सोर्स मॉडल को छोड़कर सभी से बेहतर प्रदर्शन कर सकते हैं।

जैसे-जैसे प्रगति की गति तेज होगी, अत्याधुनिक मॉडलों की लगातार बढ़ती क्षमताएं सबसे अधिक मीडिया का ध्यान आकर्षित करेंगी। लेकिन सबसे प्रभावशाली विकास शासन, मिडलवेयर, प्रशिक्षण तकनीकों और डेटा पाइपलाइनों पर केंद्रित हो सकते हैं जो जेनरेटिव एआई को और अधिक बनाते हैं भरोसेमंद, स्थायी और उद्यमों तथा अंतिम उपयोगकर्ताओं के लिए समान रूप से सुलभ।

आने वाले वर्ष में ध्यान देने योग्य कुछ महत्वपूर्ण वर्तमान एआई रुझान यहां दिए गए हैं।

  • वास्तविकता की जाँच: अधिक यथार्थवादी अपेक्षाएँ
  • मल्टीमॉडल एआई
  • छोटे (एर) भाषा मॉडल और ओपन सोर्स प्रगति
  • GPU की कमी और क्लाउड लागत
  • मॉडल अनुकूलन अधिक सुलभ होता जा रहा है
  • अनुकूलित स्थानीय मॉडल और डेटा पाइपलाइन
  • अधिक शक्तिशाली वर्चुअल एजेंट
  • विनियमन, कॉपीराइट और नैतिक एआई चिंताएँ
  • शैडो एआई (और कॉर्पोरेट एआई नीतियां)

वास्तविकता की जाँच: अधिक यथार्थवादी अपेक्षाएँ

जब जनरेटिव एआई ने पहली बार बड़े पैमाने पर जागरूकता फैलाई, तो एक विशिष्ट बिजनेस लीडर का ज्ञान ज्यादातर मार्केटिंग सामग्रियों और बेदम समाचार कवरेज से आया। वास्तविक अनुभव (यदि कोई हो) ChatGPT और DALL-E के साथ खिलवाड़ करने तक ही सीमित था। अब जबकि धूल जम गई है, व्यापारिक समुदाय को अब एआई-संचालित समाधानों की अधिक परिष्कृत समझ है।

गार्टनर हाइप साइकिल जेनेरेटिव एआई को "बढ़ी हुई उम्मीदों के चरम" पर, "मोहभंग के गर्त" में एक स्लाइड के शिखर पर स्थित करती है।[I]- दूसरे शब्दों में, एक (अपेक्षाकृत) भारी संक्रमण अवधि में प्रवेश करने वाला है - जबकि डेलॉयट की "एंटरप्राइज़ में जेनरेटेड एआई की स्थिति" Q1 2024 की रिपोर्ट से संकेत मिलता है कि कई नेता "अल्पावधि में पर्याप्त परिवर्तनकारी प्रभावों की उम्मीद करते हैं।"[द्वितीय] वास्तविकता संभवतः बीच में आ जाएगी: जेनरेटिव एआई अद्वितीय अवसर और समाधान प्रदान करता है, लेकिन यह हर किसी के लिए सब कुछ नहीं होगा।

वास्तविक दुनिया के नतीजों की तुलना प्रचार से कैसे की जाती है, यह आंशिक रूप से परिप्रेक्ष्य का विषय है। चैटजीपीटी जैसे स्टैंडअलोन उपकरण आम तौर पर लोकप्रिय कल्पना में केंद्र स्तर पर होते हैं, लेकिन स्थापित सेवाओं में सहज एकीकरण अक्सर अधिक स्थायी शक्ति प्रदान करता है। वर्तमान प्रचार चक्र से पहले, 2018 में Google द्वारा शुरू की गई "स्मार्ट कंपोज़" सुविधा जैसे जेनरेटिव मशीन लर्निंग टूल को आज की टेक्स्ट जनरेटिंग सेवाओं के अग्रदूत होने के बावजूद, एक आदर्श बदलाव के रूप में घोषित नहीं किया गया था। इसी तरह, कई उच्च-प्रभाव वाले जेनरेटिव एआई टूल को एंटरप्राइज़ वातावरण के एकीकृत तत्वों के रूप में कार्यान्वित किया जा रहा है जो मौजूदा टूल में क्रांति लाने या प्रतिस्थापित करने के बजाय बढ़ाते हैं और पूरक करते हैं: उदाहरण के लिए, माइक्रोसॉफ्ट ऑफिस में "कोपायलट" सुविधाएं, एडोब में "जेनरेटिव फिल" सुविधाएं फ़ोटोशॉप या उत्पादकता और सहयोग ऐप्स में वर्चुअल एजेंट.

जहां जेनरेटिव एआई सबसे पहले रोजमर्रा के वर्कफ़्लो में गति पैदा करता है, वहीं किसी विशिष्ट एआई क्षमताओं के काल्पनिक उलट की तुलना में एआई टूल के भविष्य पर अधिक प्रभाव पड़ेगा। एक ताजा खबर के मुताबिक आईबीएम ने उद्यम-स्तर की कंपनियों में 1,000 से अधिक कर्मचारियों का सर्वेक्षण कियाएआई को अपनाने के लिए शीर्ष तीन कारक एआई उपकरणों में प्रगति थी जो उन्हें अधिक सुलभ बनाती है, लागत कम करने और प्रमुख प्रक्रियाओं को स्वचालित करने की आवश्यकता और मानक ऑफ-द-शेल्फ व्यावसायिक अनुप्रयोगों में एम्बेडेड एआई की बढ़ती मात्रा।

मल्टीमॉडल एआई (और वीडियो)

ऐसा कहा जा रहा है कि, अत्याधुनिक जेनेरिक एआई की महत्वाकांक्षा बढ़ रही है। प्रगति की अगली लहर न केवल एक विशिष्ट डोमेन के भीतर प्रदर्शन को बढ़ाने पर ध्यान केंद्रित करेगी, बल्कि इस पर भी ध्यान केंद्रित करेगी बहुविध मॉडल जो कई प्रकार के डेटा को इनपुट के रूप में ले सकता है। जबकि विभिन्न डेटा तौर-तरीकों पर काम करने वाले मॉडल कोई बिल्कुल नई घटना नहीं हैं - CLIP जैसे टेक्स्ट-टू-इमेज मॉडल और Wave2Vec जैसे स्पीच-टू-टेक्स्ट मॉडल अब वर्षों से मौजूद हैं - वे आम तौर पर केवल एक ही दिशा में काम करते हैं, और किसी विशिष्ट कार्य को पूरा करने के लिए प्रशिक्षित किया गया।

अंतःविषय मॉडल की आने वाली पीढ़ी, जिसमें OpenAI के GPT-4V या Google के जेमिनी जैसे मालिकाना मॉडल, साथ ही LLaVa, Adept या Qwen-VL जैसे ओपन सोर्स मॉडल शामिल हैं, प्राकृतिक भाषा प्रसंस्करण (एनएलपी) और कंप्यूटर विज़न कार्यों के बीच स्वतंत्र रूप से आगे बढ़ सकते हैं। नये मॉडल भी ला रहे हैं वीडियो तह में: जनवरी के अंत में, Google ने Lumiere की घोषणा की, एक टेक्स्ट-टू-वीडियो प्रसार मॉडल जो छवि-से-वीडियो कार्य भी कर सकता है या शैली संदर्भ के लिए छवियों का उपयोग कर सकता है।

मल्टीमॉडल एआई का सबसे तात्कालिक लाभ अधिक सहज, बहुमुखी एआई एप्लिकेशन और वर्चुअल असिस्टेंट हैं। उदाहरण के लिए, उपयोगकर्ता किसी छवि के बारे में पूछ सकते हैं और प्राकृतिक भाषा में उत्तर प्राप्त कर सकते हैं, या किसी चीज़ की मरम्मत के लिए ज़ोर से निर्देश मांग सकते हैं और चरण-दर-चरण पाठ निर्देशों के साथ दृश्य सहायता प्राप्त कर सकते हैं।

उच्च स्तर पर, मल्टीमॉडल एआई एक मॉडल को अधिक विविध डेटा इनपुट को संसाधित करने, प्रशिक्षण और अनुमान के लिए उपलब्ध जानकारी को समृद्ध और विस्तारित करने की अनुमति देता है। वीडियो, विशेष रूप से, समग्र शिक्षा के लिए काफी संभावनाएं प्रदान करता है। स्टैनफोर्ड इंस्टीट्यूट फॉर ह्यूमन-सेंटर्ड आर्टिफिशियल इंटेलिजेंस (एचएआई) के प्रतिष्ठित शिक्षा फेलो पीटर नॉरविग कहते हैं, "ऐसे कैमरे हैं जो 24/7 चालू रहते हैं और वे जो कुछ भी होता है उसे बिना किसी फ़िल्टरिंग के, बिना किसी जानबूझकर कैद कर रहे हैं।" .[Iii] “एआई मॉडल में पहले इस तरह का डेटा नहीं था। उन मॉडलों को हर चीज़ की बेहतर समझ होगी।”

छोटे (एर) भाषा मॉडल और ओपन सोर्स प्रगति

डोमेन-विशिष्ट मॉडलों में - विशेष रूप से एलएलएम में - हम संभवतः बड़े पैरामीटर गणनाओं से घटते रिटर्न के बिंदु पर पहुंच गए हैं। ओपनएआई के सीईओ सैम ऑल्टमैन (जिनके जीपीटी-4 मॉडल के बारे में अफवाह है कि उनकी क्षमता लगभग 1.76 है) ट्रिलियन पैरामीटर), पिछले अप्रैल में एमआईटी के इमेजिनेशन इन एक्शन इवेंट में इतना ही सुझाव दिया गया था: "मुझे लगता है कि हम उस युग के अंत में हैं जहां ये विशाल मॉडल होंगे, और हम उन्हें अन्य तरीकों से बेहतर बनाएंगे," उन्होंने भविष्यवाणी की . "मुझे लगता है कि पैरामीटर गणना पर बहुत अधिक ध्यान दिया गया है।"

बड़े पैमाने पर मॉडलों ने इस चल रहे एआई स्वर्ण युग की शुरुआत की, लेकिन वे कमियों से रहित नहीं हैं। केवल सबसे बड़ी कंपनियों के पास सैकड़ों अरबों मापदंडों के साथ ऊर्जा-भूखे मॉडल को प्रशिक्षित करने और बनाए रखने के लिए धन और सर्वर स्थान है। वाशिंगटन विश्वविद्यालय के एक अनुमान के अनुसार, एकल GPT-3 आकार के मॉडल के प्रशिक्षण के लिए इसकी आवश्यकता होती है सालाना 1,000 से अधिक घरों की बिजली खपत; ChatGPT प्रश्नों का एक मानक दिन 33,000 अमेरिकी घरों की दैनिक ऊर्जा खपत को टक्कर देता है।[Iv]

इस बीच, छोटे मॉडल, बहुत कम संसाधन-गहन होते हैं। एक प्रभावशाली मार्च 2022 का पेपर डीपमाइंड ने प्रदर्शित किया कि अधिक डेटा पर छोटे मॉडलों को प्रशिक्षित करने से कम डेटा पर बड़े मॉडलों को प्रशिक्षित करने की तुलना में बेहतर प्रदर्शन मिलता है। एलएलएम में चल रहे अधिकांश नवाचारों ने कम मापदंडों से अधिक आउटपुट प्राप्त करने पर ध्यान केंद्रित किया है। जैसा कि 3-70 बिलियन पैरामीटर रेंज में मॉडलों की हालिया प्रगति से पता चलता है, विशेष रूप से 2 में एलएलएएमए, लामा 2023 और मिस्ट्रल फाउंडेशन मॉडल पर निर्मित मॉडलों को बहुत अधिक प्रदर्शन बलिदान के बिना छोटा किया जा सकता है।

खुले मॉडलों की शक्ति बढ़ती रहेगी। दिसंबर 2023 में, मिस्ट्रल ने "मिक्सट्रल" रिलीज़ की विशेषज्ञों का मिश्रण (एमओई) मॉडल 8 तंत्रिका नेटवर्क को एकीकृत करता है, प्रत्येक 7 अरब मापदंडों के साथ। मिस्ट्रल का दावा है कि मिक्सट्रल न केवल 70 गुना तेज अनुमान गति पर अधिकांश बेंचमार्क पर लामा 2 के 6बी पैरामीटर संस्करण से बेहतर प्रदर्शन करता है, बल्कि यह ओपनएआई से भी मेल खाता है या उससे बेहतर प्रदर्शन करता है। दूर अधिकांश मानक बेंचमार्क पर बड़ा GPT-3.5। इसके तुरंत बाद, मेटा ने जनवरी में घोषणा की कि उसने लामा 3 मॉडलों का प्रशिक्षण पहले ही शुरू कर दिया है, और पुष्टि की है कि वे ओपन सोर्स होंगे। हालाँकि विवरण (जैसे मॉडल आकार) की पुष्टि नहीं की गई है, यह उम्मीद करना उचित है कि लामा 3 पिछली दो पीढ़ियों में स्थापित ढांचे का पालन करेगा।

छोटे मॉडलों में इन प्रगति के तीन महत्वपूर्ण लाभ हैं:

  • वे एआई को लोकतांत्रिक बनाने में मदद करते हैं: छोटे मॉडल जिन्हें अधिक प्राप्य हार्डवेयर पर कम लागत पर चलाया जा सकता है, अधिक शौकीनों और संस्थानों को मौजूदा मॉडलों का अध्ययन, प्रशिक्षण और सुधार करने के लिए सशक्त बनाते हैं।
  • इन्हें छोटे उपकरणों पर स्थानीय रूप से चलाया जा सकता है: यह एज कंप्यूटिंग और इंटरनेट ऑफ थिंग्स (IoT) जैसे परिदृश्यों में अधिक परिष्कृत AI की अनुमति देता है। इसके अलावा, मॉडल को स्थानीय स्तर पर चलाने से—जैसे उपयोगकर्ता के स्मार्टफोन पर—संवेदनशील व्यक्तिगत या मालिकाना डेटा के साथ बातचीत से उत्पन्न होने वाली कई गोपनीयता और साइबर सुरक्षा चिंताओं को दूर करने में मदद मिलती है।
  • वे AI को और अधिक समझाने योग्य बनाते हैं: मॉडल जितना बड़ा होगा, यह इंगित करना उतना ही कठिन होगा कि यह महत्वपूर्ण निर्णय कैसे और कहाँ लेता है। व्याख्या करने योग्य ए.आई. एआई सिस्टम के आउटपुट को समझने, सुधारने और उस पर भरोसा करने के लिए यह आवश्यक है।

GPU की कमी और क्लाउड लागत

छोटे मॉडलों की ओर रुझान आवश्यकता के साथ-साथ उद्यमशीलता की ताकत से भी प्रेरित होगा, क्योंकि हार्डवेयर की उपलब्धता कम होने के कारण क्लाउड कंप्यूटिंग की लागत बढ़ जाती है।

स्टैनफोर्ड एचएआई के उप-निदेशक और अनुसंधान संकाय निदेशक, जेम्स लैंडे कहते हैं, "बड़ी कंपनियां (और उनमें से अधिक) सभी एआई क्षमताओं को घर में लाने की कोशिश कर रही हैं, और जीपीयू पर थोड़ा चलन है।" "यह न केवल जीपीयू उत्पादन में वृद्धि के लिए भारी दबाव पैदा करेगा, बल्कि नवप्रवर्तकों के लिए ऐसे हार्डवेयर समाधान लाने के लिए भी दबाव पैदा करेगा जो सस्ते और बनाने और उपयोग करने में आसान हों।"1

जैसा कि 2023 के अंत में ओ'रेली रिपोर्ट बताती है, क्लाउड प्रदाता वर्तमान में कंप्यूटिंग का अधिकांश बोझ उठाते हैं: अपेक्षाकृत कुछ एआई अपनाने वाले अपने स्वयं के बुनियादी ढांचे को बनाए रखते हैं, और हार्डवेयर की कमी केवल ऑन-प्रिमाइस सर्वर स्थापित करने की बाधाओं और लागतों को बढ़ाएगी। लंबी अवधि में, इससे क्लाउड लागत पर दबाव बढ़ सकता है क्योंकि प्रदाता जेनेरिक एआई की मांग को प्रभावी ढंग से पूरा करने के लिए अपने स्वयं के बुनियादी ढांचे को अद्यतन और अनुकूलित करते हैं।[V]

उद्यमों के लिए, इस अनिश्चित परिदृश्य को नेविगेट करने के लिए लचीलेपन की आवश्यकता होती है, दोनों मॉडलों के संदर्भ में - जहां आवश्यक हो तो छोटे, अधिक कुशल मॉडल पर झुकाव या व्यावहारिक होने पर बड़े, अधिक प्रदर्शन करने वाले मॉडल और तैनाती के माहौल की आवश्यकता होती है। आईबीएम के सीईओ अरविंद कृष्णा ने एक साक्षात्कार में कहा, "हम उस पर प्रतिबंध नहीं लगाना चाहते जहां लोग [एक मॉडल] तैनात करते हैं।" दिसंबर 2023 सीएनबीसी के साथ साक्षात्कार, आईबीएम के संदर्भ में वॉट्सनx प्लैटफ़ॉर्म। “तो [अगर] वे इसे एक बड़े सार्वजनिक क्लाउड पर तैनात करना चाहते हैं, तो हम इसे वहां करेंगे। यदि वे इसे आईबीएम में तैनात करना चाहते हैं, तो हम इसे आईबीएम में करेंगे। यदि वे इसे स्वयं करना चाहते हैं, और उनके पास पर्याप्त बुनियादी ढांचा है, तो हम इसे वहां करेंगे।"

मॉडल अनुकूलन अधिक सुलभ होता जा रहा है

अधिक कॉम्पैक्ट मॉडलों के प्रदर्शन को अधिकतम करने की प्रवृत्ति को ओपन सोर्स समुदाय के हालिया आउटपुट द्वारा अच्छी तरह से परोसा गया है। 

कई प्रमुख प्रगतियाँ न केवल नए फाउंडेशन मॉडल द्वारा, बल्कि प्रशिक्षण, ट्विकिंग, फाइन-ट्यूनिंग या पूर्व-प्रशिक्षित मॉडल को संरेखित करने के लिए नई तकनीकों और संसाधनों (जैसे ओपन सोर्स डेटासेट) द्वारा संचालित की गई हैं (और आगे भी जारी रहेंगी)। 2023 में प्रचलित उल्लेखनीय मॉडल-अज्ञेयवादी तकनीकों में शामिल हैं:

  • निम्न रैंक अनुकूलन (LoRA): अरबों मॉडल मापदंडों को सीधे ठीक करने के बजाय, LoRA में पूर्व-प्रशिक्षित मॉडल वज़न को फ़्रीज़ करना और प्रशिक्षण योग्य परतों को इंजेक्ट करना शामिल है - जो मॉडल वज़न में परिवर्तन के मैट्रिक्स को 2 छोटे के रूप में दर्शाता है (निचली रैंक) मैट्रिसेस - प्रत्येक ट्रांसफार्मर ब्लॉक में। यह उन मापदंडों की संख्या को नाटकीय रूप से कम कर देता है जिन्हें अद्यतन करने की आवश्यकता होती है, जो बदले में, नाटकीय रूप से फाइन-ट्यूनिंग को गति देता है और मॉडल अपडेट को संग्रहीत करने के लिए आवश्यक मेमोरी को कम करता है।
  • परिमाणीकरण: फ़ाइल आकार और विलंबता को कम करने के लिए ऑडियो या वीडियो की बिटरेट को कम करने की तरह, परिमाणीकरण मॉडल डेटा बिंदुओं का प्रतिनिधित्व करने के लिए उपयोग की जाने वाली सटीकता को कम करता है - उदाहरण के लिए, 16-बिट फ्लोटिंग पॉइंट से 8-बिट पूर्णांक तक - मेमोरी उपयोग को कम करने और अनुमान को तेज करने के लिए। QLoRA तकनीक परिमाणीकरण को LoRA के साथ जोड़ती है।
  • प्रत्यक्ष वरीयता अनुकूलन (डीपीओ): चैट मॉडल आमतौर पर उपयोग करते हैं मानव प्रतिक्रिया से सुदृढीकरण सीखना (आरएलएचएफ) मॉडल आउटपुट को मानवीय प्राथमिकताओं के अनुरूप संरेखित करना। शक्तिशाली होते हुए भी, आरएलएचएफ जटिल और अस्थिर है। डीपीओ कम्प्यूटेशनल रूप से हल्का और काफी सरल होने के साथ-साथ समान लाभ का वादा करता है।

3-70 बिलियन पैरामीटर स्पेस में ओपन सोर्स मॉडल में समानांतर प्रगति के साथ, ये विकसित तकनीकें छोटे खिलाड़ियों, जैसे स्टार्टअप और शौकिया, को परिष्कृत एआई क्षमताएं प्रदान करके एआई परिदृश्य की गतिशीलता को बदल सकती हैं जो पहले पहुंच से बाहर थीं।

अनुकूलित स्थानीय मॉडल और डेटा पाइपलाइन

इस प्रकार 2024 में उद्यम "बिग एआई" से रीपैकेज्ड सेवाओं के इर्द-गिर्द रैपर बनाने के बजाय, बीस्पोक मॉडल विकास के माध्यम से भेदभाव को आगे बढ़ा सकते हैं। साथ सही डेटा और विकास ढांचा, मौजूदा ओपन सोर्स एआई मॉडल और टूल को ग्राहक सहायता उपयोग से लेकर आपूर्ति श्रृंखला प्रबंधन से लेकर जटिल दस्तावेज़ विश्लेषण तक, लगभग किसी भी वास्तविक दुनिया के परिदृश्य के अनुरूप बनाया जा सकता है।

ओपन सोर्स मॉडल संगठनों को शक्तिशाली कस्टम एआई मॉडल विकसित करने का अवसर प्रदान करते हैं - जो उनके मालिकाना डेटा पर प्रशिक्षित होते हैं और उनकी विशिष्ट आवश्यकताओं के लिए ठीक-ठाक होते हैं - बिना अत्यधिक महंगे बुनियादी ढांचे के निवेश के। यह कानूनी, स्वास्थ्य देखभाल या वित्त जैसे क्षेत्रों में विशेष रूप से प्रासंगिक है, जहां अत्यधिक विशिष्ट शब्दावली और अवधारणाओं को पूर्व-प्रशिक्षण में फाउंडेशन मॉडल द्वारा नहीं सीखा जा सकता है।

कानूनी, वित्त और स्वास्थ्य सेवा भी ऐसे उद्योगों के प्रमुख उदाहरण हैं जो स्थानीय स्तर पर मामूली हार्डवेयर पर चलने वाले छोटे मॉडल से लाभ उठा सकते हैं। एआई प्रशिक्षण, अनुमान और रखते हुए पुनर्प्राप्ति संवर्धित पीढ़ी (आरएजी) लोकल मालिकाना डेटा या संवेदनशील व्यक्तिगत जानकारी का उपयोग बंद-स्रोत मॉडल को प्रशिक्षित करने या अन्यथा तीसरे पक्ष के हाथों से गुजरने के जोखिम से बचाता है। और सभी ज्ञान को सीधे एलएलएम के भीतर संग्रहीत करने के बजाय प्रासंगिक जानकारी तक पहुंचने के लिए आरएजी का उपयोग करने से मॉडल आकार को कम करने, गति बढ़ाने और लागत कम करने में मदद मिलती है।

जैसे-जैसे 2024 मॉडल के खेल के मैदान को समतल करता जा रहा है, प्रतिस्पर्धात्मक लाभ तेजी से मालिकाना डेटा पाइपलाइनों द्वारा संचालित होगा जो उद्योग-सर्वोत्तम फाइन-ट्यूनिंग को सक्षम बनाता है।

अधिक शक्तिशाली वर्चुअल एजेंट

अधिक परिष्कृत, कुशल उपकरणों और उनके निपटान में एक वर्ष की बाजार प्रतिक्रिया के साथ, व्यवसायों को उपयोग के मामलों का विस्तार करने के लिए तैयार किया जाता है आभासी एजेंट बिल्कुल सीधे से परे ग्राहक अनुभव चैटबॉट.

जैसे-जैसे एआई सिस्टम गति पकड़ते हैं और सूचना की नई धाराओं और प्रारूपों को शामिल करते हैं, वे न केवल संचार और निर्देशों के पालन की संभावनाओं का विस्तार करते हैं, बल्कि कार्य स्वचालन भी करते हैं। “2023 एआई के साथ चैट करने में सक्षम होने का वर्ष था। स्टैनफोर्ड के नॉरविग कहते हैं, ''कई कंपनियों ने कुछ लॉन्च किया, लेकिन बातचीत हमेशा यह रही कि आप कुछ टाइप करते हैं और यह वापस कुछ टाइप करता है।'' “2024 में, हम देखेंगे एजेंटों के लिए आपके लिए काम करवाने की क्षमता. आरक्षण करें, यात्रा की योजना बनाएं, अन्य सेवाओं से जुड़ें।

मल्टीमॉडल एआई, विशेष रूप से, आभासी एजेंटों के साथ सहज बातचीत के अवसरों को महत्वपूर्ण रूप से बढ़ाता है। उदाहरण के लिए, किसी बॉट से व्यंजनों के बारे में पूछने के बजाय, एक उपयोगकर्ता एक खुले फ्रिज पर कैमरा इंगित कर सकता है और उन व्यंजनों का अनुरोध कर सकता है जो उपलब्ध सामग्रियों से बनाए जा सकते हैं। बी माई आइज़, एक मोबाइल ऐप जो नेत्रहीन और कम दृष्टि वाले व्यक्तियों को त्वरित कार्यों में मदद करने के लिए स्वयंसेवकों से जोड़ता है, एआई टूल का संचालन कर रहा है जो उपयोगकर्ताओं को मानव स्वयंसेवक की प्रतीक्षा करने के बदले मल्टीमॉडल एआई के माध्यम से सीधे अपने परिवेश के साथ बातचीत करने में मदद करता है।

IBM watsonx™ Assistant का अन्वेषण करें: आपके व्यवसाय को शक्ति प्रदान करने वाले उपकरणों के लिए सहज एकीकरण के साथ बाजार-अग्रणी संवादात्मक AI →

विनियमन, कॉपीराइट और नैतिक एआई चिंताएँ

उन्नत मल्टीमॉडल क्षमताएं और प्रवेश के लिए कम बाधाएं भी दुरुपयोग के लिए नए दरवाजे खोलती हैं: डीपफेक, गोपनीयता के मुद्दे, पूर्वाग्रह को कायम रखना और यहां तक ​​कि कैप्चा सुरक्षा उपायों की चोरी भी बुरे अभिनेताओं के लिए आसान हो सकती है। जनवरी 2024 में, सोशल मीडिया पर स्पष्ट सेलिब्रिटी डीपफेक की लहर आ गई; मई 2023 के शोध से संकेत मिलता है कि 8 में इसी अवधि की तुलना में 2022 गुना अधिक वॉयस डीपफेक ऑनलाइन पोस्ट किए गए थे।[Vi]

विनियामक वातावरण में अस्पष्टता अल्प से मध्यम अवधि में अपनाने, या कम से कम अधिक आक्रामक कार्यान्वयन को धीमा कर सकती है। किसी उभरती हुई प्रौद्योगिकी या अभ्यास में किसी भी बड़े, अपरिवर्तनीय निवेश के लिए अंतर्निहित जोखिम है जिसके लिए नए कानून या आने वाले वर्षों में राजनीतिक प्रतिकूल परिस्थितियों में बदलाव के बाद महत्वपूर्ण पुन: उपकरण की आवश्यकता हो सकती है - या अवैध भी हो सकती है।

दिसंबर 2023 में यूरोपीय संघ (ईयू) पहुंचे आर्टिफिशियल इंटेलिजेंस अधिनियम पर अनंतिम समझौता. अन्य उपायों के अलावा, यह चेहरे की पहचान डेटाबेस बनाने के लिए छवियों की अंधाधुंध स्क्रैपिंग, भेदभावपूर्ण पूर्वाग्रह की संभावना वाले बायोमेट्रिक वर्गीकरण सिस्टम, "सामाजिक स्कोरिंग" सिस्टम और सामाजिक या आर्थिक हेरफेर के लिए एआई के उपयोग पर रोक लगाता है। यह सुरक्षा, मौलिक अधिकारों या कानून के शासन को खतरे में डालने की क्षमता वाले "उच्च जोखिम" एआई सिस्टम की एक श्रेणी को परिभाषित करने का भी प्रयास करता है, जो अतिरिक्त निरीक्षण के अधीन होगा। इसी तरह, यह "सामान्य-उद्देश्य एआई (जीपीएआई)" सिस्टम-फाउंडेशन मॉडल-तकनीकी दस्तावेज़ीकरण और प्रणालीगत प्रतिकूल परीक्षण सहित पारदर्शिता आवश्यकताओं को निर्धारित करता है।

लेकिन जबकि मिस्ट्रल जैसे कुछ प्रमुख खिलाड़ी यूरोपीय संघ में रहते हैं, अधिकांश अभूतपूर्व एआई विकास अमेरिका में हो रहा है, जहां निजी क्षेत्र में एआई के ठोस कानून के लिए कांग्रेस से कार्रवाई की आवश्यकता होगी - जो चुनावी वर्ष में संभव नहीं हो सकता है। 30 अक्टूबर को, बिडेन प्रशासन ने एक जारी किया व्यापक कार्यकारी आदेश संघीय एजेंसियों द्वारा एआई प्रौद्योगिकियों के उपयोग के लिए 150 आवश्यकताओं का विवरण; महीनों पहले प्रशासन ने सुरक्षित कर लिया था प्रमुख एआई डेवलपर्स से स्वैच्छिक प्रतिबद्धताएँ विश्वास और सुरक्षा के लिए कुछ निश्चित रेलिंगों का पालन करना। विशेष रूप से, कैलिफ़ोर्निया और कोलोराडो दोनों कृत्रिम बुद्धिमत्ता के संबंध में व्यक्तियों के डेटा गोपनीयता अधिकारों के संबंध में अपने स्वयं के कानून को सक्रिय रूप से आगे बढ़ा रहे हैं।

चीन औपचारिक एआई प्रतिबंधों की ओर अधिक सक्रिय रूप से आगे बढ़ गया है, सोशल मीडिया पर अनुशंसा एल्गोरिदम द्वारा मूल्य भेदभाव पर प्रतिबंध लगा रहा है और एआई-जनित सामग्री की स्पष्ट लेबलिंग को अनिवार्य कर रहा है। जेनेरिक एआई पर संभावित नियमों में एलएलएम को प्रशिक्षित करने के लिए उपयोग किए जाने वाले प्रशिक्षण डेटा की आवश्यकता होती है और बाद में मॉडलों द्वारा उत्पन्न सामग्री "सही और सटीक" होनी चाहिए, जिसे विशेषज्ञों ने एलएलएम आउटपुट को सेंसर करने के उपायों को इंगित करने के लिए लिया है।

इस बीच, भाषा मॉडल से लेकर छवि जनरेटर और वीडियो मॉडल तक सामग्री निर्माण के लिए उपयोग किए जाने वाले एआई मॉडल के प्रशिक्षण में कॉपीराइट सामग्री की भूमिका एक गर्मागर्म विवादित मुद्दा बनी हुई है। हाई-प्रोफाइल का नतीजा द्वारा मुकदमा दायर किया गया न्यूयॉर्क टाइम्स OpenAI के विरुद्ध एआई कानून के प्रक्षेपवक्र को महत्वपूर्ण रूप से प्रभावित कर सकता है। शत्रुतापूर्ण उपकरण, जैसे शीशे का आवरण और नैटशाइड-दोनों शिकागो विश्वविद्यालय में विकसित हुए हैं - जो रचनाकारों और मॉडल डेवलपर्स के बीच एक प्रकार की हथियारों की दौड़ बन सकते हैं।

 जानें कि कैसे IBM® watsonx.governance™ जिम्मेदार, पारदर्शी और समझाने योग्य AI वर्कफ़्लो को तेज़ करता है →

शैडो एआई (और कॉर्पोरेट एआई नीतियां)

व्यवसायों के लिए, कानूनी, विनियामक, आर्थिक या प्रतिष्ठित परिणामों की यह बढ़ती संभावना इस बात से बढ़ गई है कि जेनेरिक एआई उपकरण कितने लोकप्रिय और सुलभ हो गए हैं। संगठनों को न केवल जेनरेटिव एआई के बारे में सावधान, सुसंगत और स्पष्ट रूप से व्यक्त कॉर्पोरेट नीति रखनी चाहिए, बल्कि सावधान भी रहना चाहिए छाया ऐ: कर्मचारियों द्वारा कार्यस्थल में एआई का "अनौपचारिक" व्यक्तिगत उपयोग।

इसे "शैडो आईटी" या "बीवाईओएआई" भी कहा जाता है, शैडो एआई तब उत्पन्न होता है जब अधीर कर्मचारी त्वरित समाधान चाहते हैं (या सतर्क कंपनी नीति की तुलना में तेजी से नई तकनीक का पता लगाना चाहते हैं) अनुमोदन या निरीक्षण के लिए आईटी के माध्यम से जाने के बिना कार्यस्थल में जेनेरिक एआई लागू करते हैं। . कई उपभोक्ता-सामना वाली सेवाएँ, जिनमें से कुछ निःशुल्क हैं, गैर-तकनीकी व्यक्तियों को भी जेनरेटिव एआई टूल के उपयोग को सुधारने की अनुमति देती हैं। अर्न्स्ट एंड यंग के एक अध्ययन में, 90% उत्तरदाताओं ने कहा कि वे काम में एआई का उपयोग करते हैं।[सप्तम]

वह उद्यमशीलता की भावना शून्यता में महान हो सकती है - लेकिन उत्सुक कर्मचारियों के पास सुरक्षा, गोपनीयता या अनुपालन के संबंध में प्रासंगिक जानकारी या परिप्रेक्ष्य का अभाव हो सकता है। इससे व्यवसायों को काफी जोखिम का सामना करना पड़ सकता है। उदाहरण के लिए, कोई कर्मचारी अनजाने में सार्वजनिक-सामना वाले एआई मॉडल को व्यापार रहस्य फ़ीड कर सकता है जो लगातार उपयोगकर्ता इनपुट पर प्रशिक्षण देता है, या सामग्री निर्माण के लिए मालिकाना मॉडल को प्रशिक्षित करने और अपनी कंपनी को कानूनी कार्रवाई के लिए उजागर करने के लिए कॉपीराइट-संरक्षित सामग्री का उपयोग करता है।

चल रहे कई विकासों की तरह, यह रेखांकित करता है कि जेनेरिक एआई के खतरे इसकी क्षमताओं के साथ लगभग रैखिक रूप से कैसे बढ़ते हैं। महान शक्तियों के साथ बहुत सारी जिम्मेदारियाँ लाती हैं।

आगे बढ़ते हुए

जैसा कि हम कृत्रिम बुद्धिमत्ता में एक महत्वपूर्ण वर्ष के माध्यम से आगे बढ़ रहे हैं, क्षमता को अधिकतम करने, जोखिम को कम करने और जिम्मेदारी से जेनरेटिव एआई अपनाने को बढ़ाने के लिए उभरते रुझानों को समझना और अपनाना आवश्यक है।

वाटसनएक्स™ के साथ काम करने के लिए जेनरेटिव एआई लगाएं →

जानें कि आईबीएम आपको एआई रुझानों से आगे रहने के लिए कैसे सशक्त बना सकता है →


[I] "गार्टनर ने उभरती प्रौद्योगिकियों के लिए 2023 प्रचार चक्र पर जेनरेटिव एआई को बढ़ी हुई उम्मीदों के चरम पर रखा है," गार्टनर, 16 अगस्त 2023

[द्वितीय] "एंटरप्राइस क्वार्टर वन रिपोर्ट में डेलॉइट की जेनरेटिव एआई की स्थिति," डेलॉइट, जनवरी 2024

[Iii] "2024 में एआई में क्या उम्मीद करें," स्टैनफोर्ड यूनिवर्सिटी, 8 दिसंबर 2023

[Iv] "प्रश्नोत्तर: यूडब्ल्यू शोधकर्ता चर्चा करते हैं कि चैटजीपीटी कितनी ऊर्जा का उपयोग करता है," वाशिंगटन विश्वविद्यालय, 27 जुलाई 2023

[V] "उद्यम में जनरेटिव एआई," ओ'रेली, 28 नवंबर 2023

[Vi] "डीपफेकिंग: अमेरिका का 2024 का चुनाव एआई बूम के साथ मेल खाता है," रॉयटर्स, 30 मई 2023

[सप्तम] "संगठन एआई के बढ़ते उपयोग को चिंता बढ़ाने से कैसे रोक सकते हैं," अर्न्स्ट एंड यंग, ​​दिसंबर 2023

क्या यह लेख सहायक था?

हाँनहीं


आर्टिफिशियल इंटेलिजेंस से अधिक




असाधारण कर्मचारी अनुभव बनाना

4 मिनट लाल - जैसे-जैसे कर्मचारियों के व्यक्तिगत और व्यावसायिक जीवन के बीच की रेखा पहले से कहीं अधिक धुंधली होती जा रही है, कर्मचारी अधिक लचीले और सहानुभूतिपूर्ण कार्यस्थल की उम्मीद करते हैं जो उनके संपूर्ण अस्तित्व को ध्यान में रखे। कर्मचारी अपेक्षाओं में यह बदलाव तेजी से हो रही तकनीकी प्रगति, बढ़ते कौशल अंतराल और अप्रत्याशित सामाजिक आर्थिक मुद्दों के चुनौतीपूर्ण माहौल में हो रहा है। और सबसे बढ़कर, मानव संसाधन की प्रकृति अनुकूलन का विरोध करती है, क्योंकि कर्मचारी अनुभवों को मापना कठिन है, और संगठनों को बदलना मुश्किल है। इन चुनौतियों के बावजूद,…




6 तरीके जेनेरिक एआई परिसंपत्ति प्रबंधन को अनुकूलित कर सकते हैं

3 मिनट लाल - प्रत्येक परिसंपत्ति प्रबंधक, संगठन के आकार की परवाह किए बिना, समान जनादेशों का सामना करता है: रखरखाव योजना को सुव्यवस्थित करना, परिसंपत्ति या उपकरण की विश्वसनीयता बढ़ाना और गुणवत्ता और उत्पादकता में सुधार के लिए वर्कफ़्लो को अनुकूलित करना। हाल ही में आईबीएम इंस्टीट्यूट फॉर बिजनेस वैल्यू के मुख्य आपूर्ति श्रृंखला अधिकारियों के अध्ययन में, लगभग आधे उत्तरदाताओं ने कहा कि उन्होंने चुनौतियों के जवाब में नई प्रौद्योगिकियों को अपनाया है। पारंपरिक एआई के साथ मिलकर जनरेटिव आर्टिफिशियल इंटेलिजेंस (एआई) फाउंडेशन मॉडल की शक्ति के साथ क्षितिज पर और भी अधिक मदद उपलब्ध है…




GRAMMYs® में प्रशंसक अनुभव को बढ़ाने के लिए रिकॉर्डिंग अकादमी IBM watsonx का उपयोग कैसे करती है

3 मिनट लाल - GRAMMYs® के माध्यम से, रिकॉर्डिंग अकादमी® रिकॉर्डिंग कला और विज्ञान में उत्कृष्टता को पहचानना चाहती है और यह सुनिश्चित करना चाहती है कि संगीत हमारी संस्कृति का एक अमिट हिस्सा बना रहे। जब दुनिया के शीर्ष रिकॉर्डिंग सितारे 66वें वार्षिक ग्रैमी अवार्ड्स में रेड कार्पेट पार करेंगे, तो आईबीएम एक बार फिर वहां मौजूद होगा। इस वर्ष, GRAMMYs के सामने व्यावसायिक चुनौती अन्य प्रतिष्ठित सांस्कृतिक खेलों और मनोरंजन कार्यक्रमों के समान है: आज के अत्यधिक खंडित मीडिया परिदृश्य में, सांस्कृतिक प्रभाव पैदा करने का अर्थ है मनोरम सामग्री चलाना...




सभी के लिए एआई असिस्टेंट: वाटसनएक्स ऑर्केस्ट्रा उत्पादकता बढ़ाने के लिए जेनरेटिव एआई और ऑटोमेशन को जोड़ती है

3 मिनट लाल - क्या होगा यदि कर्मचारियों के पास समय लेने वाले कार्यों को सहजता से सौंपने, सरल पूछताछ के माध्यम से जानकारी तक निर्बाध रूप से पहुंचने और एक ही, सुव्यवस्थित एप्लिकेशन के भीतर जटिल परियोजनाओं से निपटने की क्षमता हो? क्या होगा यदि ग्राहकों के पास उत्तर देने और चौबीसों घंटे स्वयं-सेवा अनुभवों को सक्षम करने के लिए एक बुद्धिमान, मैत्रीपूर्ण वर्चुअल एजेंट तक पहुंच हो? जेनेरिक एआई संचालित स्वचालन की नवीन क्षमताओं की बदौलत यह तकनीकी क्रांति अब संभव है। एआई सहायक प्रौद्योगिकी में आज की प्रगति के साथ, कंपनियां अभूतपूर्व गति से व्यावसायिक परिणाम प्राप्त कर सकती हैं, जिससे…

आईबीएम न्यूज़लेटर्स

हमारे न्यूज़लेटर और विषय अपडेट प्राप्त करें जो नवीनतम विचार नेतृत्व और उभरते रुझानों पर अंतर्दृष्टि प्रदान करते हैं।

अभी ग्राहक बनें

अधिक समाचार पत्र

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी