जेफिरनेट लोगो

डेटा साइंस और गो प्रोग्रामिंग लैंग्वेज - केडनगेट्स

दिनांक:

प्रायोजित सामग्री

नॉर्थवेस्टर्न यूनिवर्सिटी के संकाय निदेशक टॉम मिलर की टिप्पणियाँ एमएसडीएस कार्यक्रम.

वर्षों पहले, मिनेसोटा विश्वविद्यालय में व्यावहारिक सांख्यिकी के छात्र के रूप में, मैंने अकादमिक क्षेत्र में प्रोग्रामिंग के बारे में एक पाठ सीखा। पाठ्यक्रम की शुरुआत में प्रोफेसर ने कहा,

"जब तक आप अपना काम स्वयं करते हैं, मुझे इसकी परवाह नहीं है कि आप असाइनमेंट के लिए किस भाषा का उपयोग करते हैं।"

मेरे पास फोरट्रान का अनुभव था लेकिन मैं खुद को पास्कल सिखा रहा था, एक संरचित प्रोग्रामिंग शैली अपनाने की कोशिश कर रहा था।

प्रोफेसर की बात मानकर, मैंने पहला असाइनमेंट पास्कल में प्रोग्राम किया जबकि मेरे सहपाठी फोरट्रान का उपयोग करते थे। पहला असाइनमेंट देय है। मैं अपना पेपर (एक कार्यक्रम सूची) कमरे के सामने ले जाता हूं और प्रोफेसर को सौंप देता हूं। वह इसे विचित्र दृष्टि से देखता है और पूछता है, "यह क्या है?"

मैं समझाता हूं, “यह पास्कल है। आपने हमें बताया था कि हम अपनी पसंद की किसी भी भाषा में प्रोग्राम कर सकते हैं, बशर्ते हम अपना काम खुद करते हों।''

जिस पर प्रोफेसर कहते हैं, “पास्कल। मैं पास्कल नहीं पढ़ता. मैं केवल फोरट्रान पढ़ता हूं।

सबक सीखा: शिक्षाविद विशेष रूप से नई प्रोग्रामिंग भाषाओं के लिए खुले नहीं हैं।

फोरट्रानी

फोरट्रान को आईबीएम में जॉन बैकस द्वारा विकसित किया गया था और 1957 में पेश किया गया था। जब आप इसका नाम सुनते हैं, तो "सूत्र अनुवाद" के बारे में सोचें। फोरट्रान वैज्ञानिक और इंजीनियरिंग अनुप्रयोगों के लिए आवश्यकतानुसार संख्यात्मक गणनाओं के लिए उपयुक्त है। फोरट्रान ने हाल ही में पुनरुत्थान देखा है, शायद बड़े डेटा सेट और सुपरकंप्यूटिंग की कम्प्यूटेशनल मांगों के कारण।

PASCAL

स्विस कंप्यूटर वैज्ञानिक निकोलस विर्थ द्वारा डिज़ाइन किया गया और 1970 में पेश किया गया, पास्कल ALGOL का व्युत्पन्न है। पास्कल को 1970 और 80 के दशक में कई विश्वविद्यालयों में संरचित प्रोग्रामिंग की दिशा में एक आंदोलन के साथ जोड़ा गया था। Apple और Microsoft में सिस्टम प्रोग्रामिंग के लिए पास्कल के भिन्नरूपों का उपयोग किया गया है।

 
आज अधिकांश विश्वविद्यालयों में डेटा विज्ञान के छात्रों को एक समान अनुभव होगा यदि वे पायथन या आर के बजाय गो, रस्ट, या किसी अन्य समकालीन भाषा में असाइनमेंट जमा करते।

मशीन लर्निंग एप्लिकेशन और एआई के साथ, पायथन दिन पर राज करता है। डेटा वैज्ञानिक जीवन संरक्षक जैसे पायथन नाव में नौकायन करने में संतुष्ट महसूस कर सकते हैं ऊँचा होना, पांडा, Scikit सीखने, तथा TensorFlow उनके पक्षों द्वारा

लेकिन सावधान रहें. आज का डेटा महासागर अस्थिर है। शार्क आ रही हैं.

फिल्म में चीफ ब्रॉडी द्वारा क्विंट को कहे गए शब्दों को याद करें जॉज़ : "आपको एक बड़ी नाव की आवश्यकता होगी।" मेरा सुझाव है कि गो के साथ एक बड़ी, तेज़ नाव बनाई जाए।

जाओ (गोलांग)

गो को तीन Google कंप्यूटर वैज्ञानिकों द्वारा विकसित किया गया था: रॉबर्ट ग्रिसेमर, रॉब पाइक और केन थॉम्पसन। यह सी के प्रदर्शन लाभों को बरकरार रखता है, जबकि सी की तुलना में इसके साथ काम करना आसान और सुरक्षित है। गो को 2009 में पेश किया गया था और यह Google की प्राथमिक सिस्टम प्रोग्रामिंग भाषा रही है। कई संगठनों में मिशन-महत्वपूर्ण प्रणालियों के लिए, गो C/C++, C#, Java और Python की जगह ले रहा है। गो बोर्ड गेम से अलग करने और खोज इंजनों में अधिक विश्वसनीय शब्द प्रदान करने के लिए गो को कभी-कभी "गोलंग" कहा जाता है।

डेटा साइंस करियर: जाने का कारण

शीर्षक वाली एक प्रस्तुति मेंजाने का कारण," कारमेन एंडोह ने 1980 से 2017 तक कंप्यूटर भाषाओं के विकास का पता लगाया। उन्होंने बड़ी प्रोग्रामिंग परियोजनाओं में गो का उपयोग करने के लिए एक ठोस तर्क दिया। उनका तर्क आज सच लगता है।

  • गो मशीन कुशल है. यह उन भाषाओं को मात देता है जिनकी व्याख्या की जाती है और साथ ही ऐसी भाषाएँ जो आभासी मशीनों पर निर्भर होती हैं।
  • मल्टी-कोर प्रोसेसर के प्रचलन से पहले, पायथन तीस साल से भी पहले कंप्यूटर परिदृश्य में शामिल हुआ था। पायथन एक एकल-थ्रेडेड, व्याख्या की गई भाषा है, जो उन प्रणालियों के लिए उपयुक्त नहीं है जो समवर्ती प्रसंस्करण की मांग करती हैं।
  • डेटा वैज्ञानिक भले ही पायथन में लिख रहे हों, लेकिन गणना-गहन कार्यों के लिए यह C या C++ है जो काम करता है। पायथन सिर्फ "गोंद" है जो मशीन लर्निंग बोट के टुकड़ों को एक साथ रखता है।
  • डेटा विज्ञान में अग्रणी भाषाओं, पायथन और आर पर गो के फायदे प्रदर्शित करने वाले बेंचमार्क के उदाहरण खोजने में ज्यादा समय नहीं लगता है।

कभी-कभी इसे "21वीं सदी के लिए सी" के रूप में वर्णित किया जाता है, गो एक दृढ़ता से टाइप की जाने वाली भाषा है जो सीधे मशीन कोड में संकलित होती है। यह C की तुलना में बहुत तेजी से संकलित होता है और C की तुलना में लगभग उतनी ही तेजी से निष्पादित होता है।

सी, सी++, और सी#

C को बेल लैब्स में डेनिस रिची द्वारा विकसित किया गया था और 1972 में पेश किया गया था। क्योंकि यह मेमोरी तक निम्न-स्तरीय पहुंच प्रदान करता है और मशीन निर्देशों को आसानी से मैप करता है, C कई वर्षों से एक लोकप्रिय सिस्टम प्रोग्रामिंग भाषा रही है। अधिकांश अन्य प्रोग्रामिंग भाषाओं की तुलना में C के प्रदर्शन में लाभ हैं। C++ और C#, C की संरचना और प्रदर्शन लाभ को बरकरार रखते हुए, C को ऑब्जेक्ट-ओरिएंटेड एक्सटेंशन प्रदान करते हैं।

समवर्ती प्रसंस्करण (कभी भी आसान काम नहीं) गो की एक आंतरिक विशेषता है

गो आज के मल्टीकोर डिजिटल कंप्यूटरों का लाभ उठाने के लिए उपकरणों का एक समृद्ध सेट प्रदान करता है। डेटा विज्ञान को ऐसी भाषाओं और प्रणालियों की आवश्यकता है जो आज की डेटा-संचालित, डेटा-गहन दुनिया की मांगों को संभाल सकें। डेटा साइंस को गो की जरूरत है।

गो प्रोग्रामर कुशल है। पायथन को अक्सर सीखना आसान माना जाता है। लेकिन मैं तर्क दूंगा कि पाइथॉन की तुलना में गो सीखना आसान है। गो डिज़ाइन की दृष्टि से सरल है, केवल पच्चीस कीवर्ड वाली एक भाषा है। गो को पढ़ना आसान है, उपयोग में आसान है और समय के साथ बनाए रखना आसान है।

आइए खुश हों कि गो समुदाय के नेता नई सुविधाएँ जोड़ने के लिए अनिच्छुक हैं। डोनाल्ड नथ सही विचार था. जब उसे इसका संस्करण 3.14 मिला टेक्स, उन्होंने घोषणा की कि भाषा का कोई नया संस्करण नहीं होगा, कोई नई सुविधाएँ नहीं होंगी, केवल बग फिक्स होंगे। और प्रत्येक बग फिक्स के साथ, वह π (pi) से एक और अंक उधार लेगा।

गो प्रोग्रामर्स का एक मंत्र: “इसे सरल रखें। इसे चालू रखो।”

प्रोग्रामर के बीच एक समान शैली सुनिश्चित करने के लिए गो में फ़ॉर्मेटिंग उपयोगिताओं के साथ एक अच्छी तरह से परिभाषित संरचना है, एक शैली जिसे कभी-कभी "मुहावरेदार गो" कहा जाता है। गो में स्वचालित मेमोरी प्रबंधन (कचरा संग्रहण) है, जो प्रोग्रामर को मेमोरी लीक और त्रुटियों से बचाता है। Go, C और C++ से अधिक सुरक्षित है।

गो कोर डेवलपर्स की बैकवर्ड संगतता के प्रति प्रतिबद्धता है, और गो का मॉड्यूल सिस्टम सुरक्षा को बढ़ावा देता है, यह सुनिश्चित करता है कि संकलन समय पर प्रत्येक बिल्ड में सही पैकेज शामिल किए गए हैं। जैसे-जैसे सॉफ़्टवेयर स्टैक बढ़ता है, गो सॉफ़्टवेयर संस्करणों पर नज़र रखता है।

सॉफ्टवेयर विकास को जेंगा के खेल के रूप में सोचें। हम यह सुनिश्चित करते हुए कि पूरा स्टैक ढह न जाए, स्टैक के निचले भाग के ब्लॉकों तक पहुंच बनाना चाहते हैं। जाओ हमें यह करने दो।

गो सॉफ्टवेयर स्टैक को सरल बनाता है। सॉफ़्टवेयर स्टैक, बुनियादी ढांचे के बारे में क्या?

जब पायथन (यहां तक ​​कि C या C++ द्वारा समर्थित) भी कार्य के लिए उपयुक्त नहीं होता है, तो डेटा वैज्ञानिक अन्य भाषाओं और प्रणालियों की ओर रुख करते हैं। यहां पायथन की प्रदर्शन समस्याओं का एक तथाकथित समाधान दिया गया है:

 
डेटा साइंस और गो प्रोग्रामिंग लैंग्वेज

डेटा साइंस और गो प्रोग्रामिंग लैंग्वेज
 

उच्च-प्रदर्शन समाधानों को लागू करने के लिए, डेटा वैज्ञानिक स्पार्क की ओर रुख करते हैं, जो स्काला पर बनाया गया है, जो जावा वर्चुअल मशीन पर निर्भर करता है। और आसान पहुंच प्रदान करने के लिए, ये नेक इरादे वाले डेटा वैज्ञानिक मिश्रण में PySpark जोड़ते हैं। क्या यह पायथन की प्रदर्शन समस्याओं का समाधान करने का सबसे अच्छा तरीका है? नहीं।

एक सरल सॉफ़्टवेयर स्टैक पर विचार करें. यह जाना है, बस जाओ:

 
डेटा साइंस और गो प्रोग्रामिंग लैंग्वेज

डेटा साइंस और गो प्रोग्रामिंग लैंग्वेज
 

गोफ़रकॉन सम्मेलनों से कोड उदाहरणों के साथ 2021 और 2023, डैनियल व्हाइटनैक दिखाता है कि गो में मशीन लर्निंग और कृत्रिम बुद्धिमत्ता समाधानों को कैसे लागू किया जाए। हम एकीकृत, बुद्धिमान वेब एप्लिकेशन बनाने के लिए गो का उपयोग कर सकते हैं, जिनमें जेनरेटिव एआई और बड़े भाषा मॉडल पर कॉल करने वाले एप्लिकेशन भी शामिल हैं।

गो आज के मल्टीकोर, डिजिटल कंप्यूटरों के लिए सर्वोत्कृष्ट सिस्टम प्रोग्रामिंग भाषा का प्रतिनिधित्व करता है। गो बादल की भाषा है. गो वितरित कंप्यूटिंग की भाषा है। डेटा वैज्ञानिक जो पायथन को अतीत की "गोंद भाषा" के रूप में देखते थे, अब गो को "सुपर ग्लू" के रूप में देख सकते हैं।

गो का उद्योग में व्यापक रूप से उपयोग किया जाता है। कंपनियां गो की सुरक्षा, सरलता और प्रदर्शन को महत्व देती हैं। वे बैकएंड सिस्टम प्रोग्रामिंग वातावरण के रूप में गो की ताकत को भी पहचानते हैं। गो वेब और डेटाबेस सर्वर, एप्लिकेशन प्रोग्रामिंग इंटरफेस और माइक्रोसर्विसेज विकसित करने के लिए उपयुक्त है। गो स्केलेबल, उच्च-प्रदर्शन प्रणालियों को लागू करने के लिए उपयुक्त है।

गो के जन्मस्थान गूगल से शुरुआत करके, कई कंपनियां बड़े, मिशन-महत्वपूर्ण सिस्टम के लिए गो पर भरोसा करती हैं। यदि गो काफी अच्छा है गूगल, नेटफ्लिक्स, Uber, ड्रॉपबॉक्स, पेपैल, अमेरिकन एक्सप्रेस, एक राजधानी, Salesforce, Zillow, और कई अन्य, तो गो हममें से बाकी लोगों के लिए काफी अच्छा है।

यदि गो निर्माण के लिए एक प्रभावी मंच प्रदान कर सकता है डाक में काम करनेवाला मज़दूर, Kubernetes, प्रोमिथेउस, ग्राफाना, मोटे चमड़े का जनवार, terraform, CrowdStrike, इत्यादि, कॉकरोचडीबी, बुनना, मिलवस, एयरोस्पाइक, और वितरित प्रणालियों और क्लाउड-नेटिव माइक्रोसर्विसेज की एक विविध श्रृंखला, तो गो डेटा विज्ञान अनुप्रयोगों के निर्माण के लिए एक प्रभावी मंच हो सकता है।

कंप्यूटर विज्ञान और डेटा विज्ञान शिक्षकों को उद्योग से सीखना चाहिए। उन्हें अपने पाठ्यक्रमों में गो को जोड़ना चाहिए। हम नॉर्थवेस्टर्न में यही कर रहे हैं।

नॉर्थवेस्टर्न में डेटा विज्ञान के लिए तीन भाषाएँ

डेटा विज्ञान के लिए गो का उपयोग करने का मतलब यह नहीं है कि हमें आर और पायथन द्वारा प्रदान की जाने वाली अच्छी चीजों को छोड़ देना चाहिए। हम बहुभाषी हो सकते हैं.

उन परियोजनाओं की कल्पना करना कठिन नहीं है जिनके लिए एक डेटा वैज्ञानिक आर के साथ डेटा का पता लगा सकता है, पायथन के साथ मॉडल विकसित कर सकता है और गो में सिस्टम लागू कर सकता है। डेटा विज्ञान के लिए तीन भाषाओं में से, गो सबसे नई है। गो ऊपर की ओर बढ़ रहा है और नौकरी के पर्याप्त अवसर प्रदान करता है।

नॉर्थवेस्टर्न का डेटा विज्ञान कार्यक्रम कार्यक्रम के साथ विशेषज्ञताओं में डेटा विज्ञान के लिए तीन भाषाओं की ताकत की सराहना करता है।

  • एनालिटिक्स और मॉडलिंग के लिए कई पैकेजों के साथ आर, लागू सांख्यिकीविदों द्वारा अच्छी तरह से माना जाता है। यह वैज्ञानिक प्रोग्रामिंग और अनुप्रयुक्त अनुसंधान के लिए एक उत्कृष्ट विकल्प है। आर डेटा की खोज और विज़ुअलाइज़ेशन के लिए विशेष रूप से अच्छा है। नॉर्थवेस्टर्न के एनालिटिक्स और मॉडलिंग विशेषज्ञता के अधिकांश पाठ्यक्रमों में आर प्राथमिक भाषा है।
  • पायथन वर्तमान में डेटा विज्ञान में सबसे लोकप्रिय कंप्यूटर भाषा है। यह प्राकृतिक भाषा प्रसंस्करण में विशेष रूप से मजबूत है और गहन शिक्षण प्लेटफार्मों के लिए प्राथमिक ग्राहक के रूप में कार्य करता है। पायथन मॉडल विकसित करने के लिए एक सुविधा संपन्न वातावरण प्रदान करता है, और नॉर्थवेस्टर्न के आर्टिफिशियल इंटेलिजेंस विशेषज्ञता में अधिकांश पाठ्यक्रमों में पायथन प्राथमिक भाषा है।
  • गो एक सिस्टम प्रोग्रामिंग भाषा है जिसे आज के मल्टी-प्रोसेसर कंप्यूटरों के लिए डिज़ाइन किया गया है। यह वेब एप्लिकेशन और डेटाबेस सर्वर सहित डेटा विज्ञान के लिए स्केलेबल, उच्च-प्रदर्शन प्रणालियों को लागू करने के लिए उपयुक्त है। गो, नॉर्थवेस्टर्न की डेटा इंजीनियरिंग विशेषज्ञता में प्राथमिक भाषा है, जैसा कि इसमें दिखाया गया है डेटा विज्ञान के लिए आगे बढ़ें सीखना वेबसाइट।

में छात्र डेटा साइंस में नॉर्थवेस्टर्न यूनिवर्सिटी का ऑनलाइन एमएस कार्यक्रम विभिन्न क्षेत्रों में सूचित, प्रभावशाली निर्णय लेने के लिए डेटा का विश्लेषण और व्याख्या करने के लिए आवश्यक आवश्यक विश्लेषण और नेतृत्व कौशल का निर्माण करता है। कक्षाओं का नेतृत्व उद्योग विशेषज्ञों के एक कुशल संकाय द्वारा किया जाता है। छात्र सामान्य डेटा साइंस ट्रैक या पांच विशेषज्ञताओं में से एक का चयन करके अपनी रुचि के क्षेत्रों में विशेषज्ञता विकसित करते हैं: एनालिटिक्स और मॉडलिंग, एनालिटिक्स प्रबंधन, आर्टिफिशियल इंटेलिजेंस, डेटा इंजीनियरिंग और प्रौद्योगिकी उद्यमिता। छात्र अंशकालिक रूप से, पूरी तरह से ऑनलाइन अपनी गति से सीखते हैं। आवेदन त्रैमासिक स्वीकार किए जाते हैं।

 
डेटा साइंस और गो प्रोग्रामिंग लैंग्वेज

डेटा साइंस और गो प्रोग्रामिंग लैंग्वेज
 
 

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी