जेफिरनेट लोगो

क्या हम साधारण मॉडलों को कम महत्व दे रहे हैं? - केडीनगेट्स

दिनांक:

क्या हम साधारण मॉडलों को कम महत्व दे रहे हैं?
DALL-E 2 द्वारा निर्मित छवि
 

मशीन-लर्निंग की दुनिया में मौजूदा रुझान उन्नत मॉडलों के बारे में है। मुख्य रूप से कई पाठ्यक्रमों के गो-टू मॉडल द्वारा प्रेरित आंदोलन जटिल मॉडल है, और डीप लर्निंग या एलएलएम जैसे मॉडल का उपयोग करना अधिक अविश्वसनीय लगता है। व्यवसायी लोगों ने भी इस धारणा में मदद नहीं की क्योंकि उन्होंने केवल लोकप्रिय प्रवृत्ति देखी।

सरलता का मतलब निराशाजनक परिणाम नहीं है। एक सरल मॉडल का मतलब केवल यह है कि समाधान देने के लिए वह जिन चरणों का उपयोग करता है वे उन्नत मॉडल की तुलना में कम जटिल हैं। इसमें कम पैरामीटर या सरल अनुकूलन विधियों का उपयोग हो सकता है, लेकिन एक सरल मॉडल अभी भी मान्य है। 

दर्शन सिद्धांत का जिक्र करते हुए, ओकेम का रेजर या पारसीमोनी का नियम कहता है कि सबसे सरल व्याख्या आमतौर पर सबसे अच्छी होती है। इसका तात्पर्य यह है कि अधिकांश समस्याओं को आमतौर पर सबसे सरल दृष्टिकोण के माध्यम से हल किया जा सकता है। इसीलिए समस्या को हल करने के लिए सरल मॉडल मान अपनी सरल प्रकृति में है।

एक साधारण मॉडल किसी भी प्रकार के मॉडल जितना ही महत्वपूर्ण है। यह वह महत्वपूर्ण संदेश है जो लेख व्यक्त करना चाहता है, और हम इसका कारण तलाशेंगे। तो, आइए इसमें शामिल हों।

जब हम सरल मॉडल के बारे में बात करते हैं, तो एक साधारण मॉडल क्या होता है? लॉजिस्टिक रिग्रेशन या नाइव बेयस को अक्सर एक सरल मॉडल कहा जाता है, जबकि तंत्रिका नेटवर्क जटिल होते हैं; बेतरतीब जंगल के बारे में क्या ख्याल है? क्या यह एक सरल या जटिल मॉडल है?

आम तौर पर, हम रैंडम फ़ॉरेस्ट को एक सरल मॉडल के रूप में वर्गीकृत नहीं करते थे, लेकिन अक्सर इसे जटिल के रूप में वर्गीकृत करने में झिझकते थे। ऐसा इसलिए है क्योंकि मॉडल के सरल स्तर के वर्गीकरण को कोई सख्त नियम नियंत्रित नहीं करता है। हालाँकि, कुछ पहलू हैं जो मॉडल को वर्गीकृत करने में मदद कर सकते हैं। वे हैं:

- पैरामीटर्स की संख्या,

– व्याख्यात्मकता,

- कम्प्यूटेशनल दक्षता.

ये पहलू लाभ मॉडल को भी प्रभावित करते हैं। आइए उन पर अधिक विस्तार से चर्चा करें।

पैरामीटर्स की संख्या

पैरामीटर एक अंतर्निहित मॉडल कॉन्फ़िगरेशन है जिसे प्रशिक्षण प्रक्रिया के दौरान सीखा या अनुमानित किया जाता है। हाइपरपैरामीटर की अवधारणा से भिन्न, पैरामीटर प्रारंभ में उपयोगकर्ता द्वारा सेट नहीं किया जा सकता है लेकिन हाइपरपैरामीटर विकल्पों से प्रभावित होता है।

मापदंडों के उदाहरणों में रैखिक प्रतिगमन गुणांक, तंत्रिका नेटवर्क वजन और पूर्वाग्रह, और के-साधन क्लस्टर सेंट्रोइड शामिल हैं। जैसा कि आप देख सकते हैं, जैसा कि हम डेटा से सीखते हैं, मॉडल मापदंडों के मान स्वतंत्र रूप से बदलते हैं। अंतिम मॉडल मौजूद होने तक मॉडल पुनरावृत्ति में पैरामीटर मान लगातार अपडेट किया जाता है।

रैखिक प्रतिगमन एक सरल मॉडल है क्योंकि इसमें कुछ पैरामीटर हैं। रैखिक प्रतिगमन पैरामीटर उनके गुणांक और अवरोधन हैं। हमारे द्वारा प्रशिक्षित सुविधाओं की संख्या के आधार पर, रैखिक प्रतिगमन होगा + 1 n पैरामीटर (n इंटरसेप्ट के लिए फीचर गुणांक प्लस 1 की संख्या है)।

न्यूरल नेटवर्क की तुलना में, मॉडल की गणना करना अधिक जटिल है। एनएन में पैरामीटर में वजन और पूर्वाग्रह शामिल हैं। वजन परत इनपुट पर निर्भर करेगा (n) और न्यूरॉन्स (p), और वजन पैरामीटर संख्या n*p होगी। प्रत्येक न्यूरॉन का अपना पूर्वाग्रह होगा, इसलिए प्रत्येक के लिए p, वहाँ एक होगा p पक्षपात। कुल मिलाकर, पैरामीटर आसपास होंगे (एन*पी) + पी संख्या। फिर परतों के प्रत्येक जोड़ के साथ जटिलता बढ़ती जाती है, जहाँ प्रत्येक अतिरिक्त परत बढ़ती जाएगी (एन*पी) + पी मापदंडों।

हमने देखा है कि मापदंडों की संख्या मॉडल जटिलता को प्रभावित करती है, लेकिन यह समग्र मॉडल आउटपुट प्रदर्शन को कैसे प्रभावित करती है? सबसे महत्वपूर्ण अवधारणा यह है कि यह ओवरफिटिंग जोखिमों को प्रभावित करती है। 

ओवरफिटिंग तब होती है जब हमारे मॉडल एल्गोरिदम में सामान्यीकरण शक्ति खराब होती है क्योंकि यह डेटासेट में शोर सीख रहा होता है। अधिक मापदंडों के साथ, मॉडल डेटा में अधिक जटिल पैटर्न कैप्चर कर सकता है, लेकिन इसमें शोर भी शामिल है क्योंकि मॉडल मानता है कि वे महत्वपूर्ण हैं। इसके विपरीत, एक छोटे पैरामीटर मॉडल में सीमित क्षमता होती है, जिसका अर्थ है कि इसे ओवरफिट करना कठिन है।

व्याख्यात्मकता और कम्प्यूटेशनल दक्षता पर भी इसका सीधा प्रभाव पड़ता है, जिस पर हम आगे चर्चा करेंगे।

विवेचनीयता

इंटरप्रिटेबिलिटी एक मशीन लर्निंग अवधारणा है जो आउटपुट को समझाने के लिए मशीन लर्निंग की क्षमता को संदर्भित करती है। मूल रूप से, यह है कि उपयोगकर्ता मॉडल व्यवहार से आउटपुट को कैसे समझ सकता है। सरल मॉडल का महत्वपूर्ण मूल्य उनकी व्याख्या में है, और यह कम संख्या में मापदंडों से आने वाला प्रत्यक्ष प्रभाव है। 

कम मापदंडों के साथ, सरल मॉडल की व्याख्या अधिक हो जाती है क्योंकि मॉडल को समझाना आसान होता है। इसके अलावा, मॉडल की आंतरिक कार्यप्रणाली अधिक पारदर्शी है क्योंकि जटिल पैरामीटर की तुलना में प्रत्येक पैरामीटर की भूमिका को समझना आसान है। 

उदाहरण के लिए, रैखिक प्रतिगमन गुणांक को समझाना अधिक सरल है क्योंकि गुणांक पैरामीटर सीधे सुविधा को प्रभावित करता है। इसके विपरीत, एनएन जैसा जटिल मॉडल भविष्यवाणी आउटपुट में पैरामीटर के प्रत्यक्ष योगदान को समझाने के लिए चुनौतीपूर्ण है। 

कई व्यावसायिक क्षेत्रों या परियोजनाओं में व्याख्यात्मकता का मूल्य बहुत अधिक है क्योंकि किसी विशेष व्यवसाय के लिए आउटपुट की व्याख्या की आवश्यकता होती है। उदाहरण के लिए, चिकित्सा क्षेत्र की भविष्यवाणी के लिए व्याख्या की आवश्यकता होती है क्योंकि चिकित्सा विशेषज्ञ को परिणाम के प्रति आश्वस्त होने की आवश्यकता होती है; आख़िरकार, यह व्यक्तिगत जीवन को प्रभावित कर रहा है।

मॉडल निर्णय में पूर्वाग्रह से बचने के लिए ही कई लोग सरल मॉडल का उपयोग करना पसंद करते हैं। कल्पना कीजिए कि एक ऋण कंपनी पूर्वाग्रहों से भरे डेटासेट के साथ एक मॉडल को प्रशिक्षित करती है, और आउटपुट इन पूर्वाग्रहों को दर्शाता है। हम पूर्वाग्रहों को ख़त्म करना चाहते हैं क्योंकि वे अनैतिक हैं, इसलिए उनका पता लगाने के लिए व्याख्यात्मकता महत्वपूर्ण है।

कम्प्यूटेशनल दक्षता

कम मापदंडों का एक और प्रत्यक्ष प्रभाव कम्प्यूटेशनल दक्षता में वृद्धि है। मापदंडों की कम संख्या का मतलब है मापदंडों को खोजने के लिए कम समय और कम कम्प्यूटेशनल शक्ति। 

उत्पादन में, उच्च कम्प्यूटेशनल दक्षता वाला एक मॉडल तैनात करने के लिए अधिक सुलभ हो जाएगा और एप्लिकेशन में अनुमान लगाने का समय कम होगा। इसके प्रभाव से सरल मॉडलों को स्मार्टफोन जैसे संसाधन-बाधित उपकरणों पर अधिक आसानी से तैनात किया जा सकेगा।

कुल मिलाकर, एक सरल मॉडल कम संसाधनों का उपयोग करेगा, जिससे प्रसंस्करण और तैनाती पर कम पैसा खर्च होगा।

हम एक साधारण मॉडल को कम महत्व दे सकते हैं क्योंकि यह आकर्षक नहीं दिखता है या सबसे इष्टतम मेट्रिक्स आउटपुट प्रदान नहीं करता है। हालाँकि, ऐसे कई मूल्य हैं जिन्हें हम सरल मॉडल से ले सकते हैं। मॉडल की सादगी को वर्गीकृत करने वाले पहलू पर एक नज़र डालकर, सरल मॉडल ये मान लाता है:

- सरल मॉडल में मापदंडों की संख्या कम होती है, लेकिन वे ओवरफिटिंग के जोखिम को भी कम करते हैं,

- कम मापदंडों के साथ, सरल मॉडल उच्च व्याख्यात्मकता मूल्य प्रदान करता है,

- इसके अलावा, कम पैरामीटर का मतलब है कि सरल मॉडल कम्प्यूटेशनल रूप से कुशल है।
 
 

कार्नेलियस युधा विजया एक डेटा साइंस असिस्टेंट मैनेजर और डेटा राइटर है। एलियांज इंडोनेशिया में पूर्णकालिक काम करते हुए, उन्हें सोशल मीडिया और राइटिंग मीडिया के माध्यम से पायथन और डेटा टिप्स साझा करना पसंद है।

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी