जेफिरनेट लोगो

आपको अपने एआई की वंशावली जानने की आवश्यकता क्यों है?

दिनांक:

टीका

आर्टिफिशियल इंटेलिजेंस (एआई) हमारे दैनिक जीवन के लगभग हर पहलू को तेजी से बदल रहा है, हमारे काम करने के तरीके से लेकर जानकारी ग्रहण करने के तरीके से लेकर हम अपने नेताओं को कैसे निर्धारित करते हैं तक। किसी भी तकनीक की तरह, एआई नैतिक है, लेकिन इसका उपयोग समाज को आगे बढ़ाने के लिए किया जा सकता है नुकसान पहुंचाना.

डेटा वह जीन है जो AI अनुप्रयोगों को शक्ति प्रदान करता है। यह डीएनए और आरएनए सभी एक में लिपटे हुए हैं। जैसा कि सॉफ़्टवेयर सिस्टम बनाते समय अक्सर कहा जाता है: "कचरा अंदर/कचरा बाहर।" एआई तकनीक उतनी ही सटीक, सुरक्षित और कार्यात्मक है जितने डेटा स्रोत जिस पर वह निर्भर करती है। यह सुनिश्चित करने की कुंजी कि एआई अपना वादा पूरा करे और अपने बुरे सपने से बचे, कचरे को बाहर रखने और इसे लाखों एआई अनुप्रयोगों में फैलने और दोहराने से रोकने की क्षमता में निहित है।

इसे डेटा उद्गम कहा जाता है, और हम उन नियंत्रणों को लागू करने के लिए एक और दिन इंतजार नहीं कर सकते हैं जो हमारे एआई भविष्य को बड़े पैमाने पर कूड़े का ढेर बनने से रोकते हैं।

खराब डेटा एआई मॉडल की ओर ले जाता है जो सेकंडों में वैश्विक स्तर पर साइबर सुरक्षा कमजोरियों, गलत सूचना और अन्य हमलों को फैला सकता है। आज का जनरेटिव ए.आई. (GenAI) मॉडल अविश्वसनीय रूप से जटिल हैं, लेकिन, मूल रूप से, GenAI मॉडल मौजूदा पिछले डेटा के एक सेट को देखते हुए, आउटपुट के लिए डेटा के सर्वोत्तम अगले हिस्से की भविष्यवाणी कर रहे हैं।

सटीकता का माप

चैटजीपीटी-प्रकार का मॉडल उन शब्दों के सेट का मूल्यांकन करता है जो पूछे गए मूल प्रश्न को बनाते हैं और आउटपुट के लिए अगले सर्वोत्तम शब्द की गणना करने के लिए मॉडल प्रतिक्रिया में अब तक के सभी शब्दों का मूल्यांकन करते हैं। वह ऐसा तब तक बार-बार करता है जब तक वह यह निर्णय नहीं ले लेता कि उसने पर्याप्त प्रतिक्रिया दे दी है। मान लीजिए कि आप उन शब्दों को एक साथ जोड़ने की मॉडल की क्षमता का मूल्यांकन करते हैं जो अच्छी तरह से गठित, व्याकरणिक रूप से सही वाक्य बनाते हैं जो विषय पर हैं और आम तौर पर बातचीत के लिए प्रासंगिक हैं। उस मामले में, आज के मॉडल आश्चर्यजनक रूप से अच्छे हैं - सटीकता का माप।

और गहराई में उतरो क्या AI-निर्मित पाठ हमेशा "सही" जानकारी देता है और संप्रेषित जानकारी के विश्वास स्तर को उचित रूप से इंगित करता है। यह उन मुद्दों का खुलासा करता है जो औसतन बहुत अच्छी भविष्यवाणी करने वाले मॉडल से आते हैं, लेकिन किनारे के मामलों में इतनी अच्छी तरह से नहीं - एक मजबूती समस्या का प्रतिनिधित्व करते हैं। यह तब जटिल हो सकता है जब एआई मॉडल से खराब डेटा आउटपुट को ऑनलाइन संग्रहीत किया जाता है और इन और अन्य मॉडलों के लिए भविष्य के प्रशिक्षण डेटा के रूप में उपयोग किया जाता है।

खराब आउटपुट को ऐसे पैमाने पर दोहराया जा सकता है जिसे हमने पहले कभी नहीं देखा है, जिससे एआई में गिरावट आ सकती है।

यदि कोई बुरा अभिनेता इस प्रक्रिया में मदद करना चाहता है, तो वे जानबूझकर अतिरिक्त खराब डेटा को उत्पादित, संग्रहीत और प्रचारित करने के लिए प्रोत्साहित कर सकते हैं - जिससे चैटबॉट्स से और भी अधिक गलत जानकारी सामने आ सकती है, या ऑटोमोबाइल ऑटोपायलट मॉडल के रूप में नापाक और डरावना कुछ ऐसा हो सकता है जो यह निर्णय ले रहा हो कि उन्हें ऐसा करने की आवश्यकता है। यदि वे अपने सामने एक विशेष रूप से तैयार की गई छवि को "देखते" हैं (निश्चित रूप से काल्पनिक रूप से), तो रास्ते में आने वाली वस्तुओं के बावजूद कार को तुरंत दाईं ओर मोड़ें।

दशकों के बाद, साइबर सुरक्षा इन्फ्रास्ट्रक्चर सुरक्षा एजेंसी के नेतृत्व में सॉफ्टवेयर विकास उद्योग अंततः इसे लागू कर रहा है सुरक्षित-दर-डिजाइन ढांचा। सुरक्षित-दर-डिजाइन यह आदेश दिया गया है कि साइबर सुरक्षा सॉफ्टवेयर विकास प्रक्रिया की नींव में है, और इसके मूल सिद्धांतों में से एक को प्रत्येक सॉफ्टवेयर विकास घटक की कैटलॉगिंग की आवश्यकता है - ए सामग्री का सॉफ्टवेयर बिल (एसबीओएम) - सुरक्षा और लचीलापन बढ़ाने के लिए। अंत में, बाजार में जाने के लिए सबसे महत्वपूर्ण कारक के रूप में सुरक्षा गति की जगह ले रही है।

एआई डिज़ाइन सुरक्षित करना

एआई को कुछ इसी तरह की जरूरत है। एआई फीडबैक लूप सामान्य पिछली साइबर सुरक्षा रक्षा तकनीकों को रोकता है, जैसे मैलवेयर हस्ताक्षरों को ट्रैक करना, नेटवर्क संसाधनों के आसपास परिधि बनाना, या कमजोरियों के लिए मानव-लिखित कोड को स्कैन करना। हमें प्रौद्योगिकी के प्रारंभिक चरण के दौरान सुरक्षित एआई डिज़ाइन को एक आवश्यकता बनाना चाहिए ताकि पेंडोरा का पिटारा खुलने से बहुत पहले ही एआई को सुरक्षित बनाया जा सके।

तो, हम इस समस्या का समाधान कैसे करें? हमें शिक्षा जगत से एक पन्ना लेना चाहिए। हम छात्रों को उच्च क्यूरेटेड प्रशिक्षण डेटा के साथ प्रशिक्षित करते हैं, व्याख्या करते हैं और शिक्षकों के एक उद्योग के माध्यम से उन्हें बताते हैं। हम वयस्कों को सिखाने के लिए इस दृष्टिकोण को जारी रखते हैं, लेकिन वयस्कों से अपेक्षा की जाती है कि वे स्वयं अधिक डेटा क्यूरेशन करें।

एआई मॉडल प्रशिक्षण के लिए दो-चरणीय क्यूरेटेड डेटा दृष्टिकोण अपनाने की आवश्यकता है। शुरू करने के लिए, बेस एआई मॉडल को भारी मात्रा में कम-क्यूरेटेड डेटा सेट का उपयोग करके वर्तमान पद्धतियों का उपयोग करके प्रशिक्षित किया जाएगा। ये बेस लार्ज लैंग्वेज मॉडल (एलएलएम) मोटे तौर पर नवजात शिशु के समान होंगे। इसके बाद बेस-स्तरीय मॉडलों को उच्च क्यूरेटेड डेटा सेट के साथ प्रशिक्षित किया जाएगा, जैसे बच्चों को वयस्क बनने के लिए सिखाया और बड़ा किया जाता है।

सभी प्रकार के लक्ष्यों के लिए बड़े, क्यूरेटेड प्रशिक्षण डेटा सेट बनाने का प्रयास छोटा नहीं होगा। यह उन सभी प्रयासों के अनुरूप है जो माता-पिता, स्कूल और समाज बच्चों को गुणवत्तापूर्ण वातावरण और गुणवत्तापूर्ण जानकारी प्रदान करने के लिए करते हैं क्योंकि वे बड़े होकर (उम्मीद है) कामकाजी, समाज में मूल्यवर्धित योगदानकर्ता बनते हैं। यह गुणवत्तापूर्ण, अच्छी तरह से काम करने वाले, कम से कम दूषित एआई मॉडल को प्रशिक्षित करने के लिए गुणवत्ता डेटा सेट बनाने के लिए आवश्यक प्रयास का स्तर है, और यह एआई मॉडल को अपने लक्ष्य कार्य में अच्छा होने के लिए सिखाने के लिए एआई और मनुष्यों के पूरे उद्योग को एक साथ काम करने के लिए प्रेरित कर सकता है। .

आज की एआई प्रशिक्षण प्रक्रिया की स्थिति इस दो-चरणीय प्रक्रिया के कुछ संकेत दिखाती है। लेकिन, GenAI प्रौद्योगिकी और उद्योग की प्रारंभिक अवस्था के कारण, बहुत अधिक प्रशिक्षण के लिए कम क्यूरेटेड, चरण-एक दृष्टिकोण की आवश्यकता होती है।

जब एआई सुरक्षा की बात आती है, तो हम एक घंटा तो क्या, एक दशक तक भी इंतजार नहीं कर सकते। एआई को एक 23andMe एप्लिकेशन की आवश्यकता है जो "एल्गोरिदम वंशावली" की पूर्ण समीक्षा को सक्षम बनाता है ताकि डेवलपर्स एआई के "पारिवारिक" इतिहास को पूरी तरह से समझ सकें ताकि पुरानी समस्याओं को दोहराने, उन महत्वपूर्ण प्रणालियों को संक्रमित करने से रोका जा सके जिन पर हम हर दिन भरोसा करते हैं, और आर्थिक और सामाजिक नुकसान पैदा करते हैं। वह अपरिवर्तनीय हो सकता है.

हमारी राष्ट्रीय सुरक्षा इस पर निर्भर करती है।

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी