जेफिरनेट लोगो

वाटसनक्स ऑर्डर्स के पीछे परिवर्तनकारी एआई तकनीक का अनावरण - आईबीएम ब्लॉग

दिनांक:


वाटसनक्स ऑर्डर्स के पीछे परिवर्तनकारी एआई तकनीक का अनावरण - आईबीएम ब्लॉग



खुले चेहरे वाले बर्गर के ऊपर बीबीक्यू सॉस डाला जा रहा है

आप फ्राइज़ और चीज़बर्गर लेने के लिए अपने पसंदीदा ड्राइव-थ्रू की ओर जा रहे हैं। यह एक सरल आदेश है और जैसे ही आप अंदर खींचते हैं आप देखते हैं कि वहां कोई अधिक लाइन नहीं है। संभवतः क्या गलती हो सकती है? बहुत।

रेस्तरां एक व्यस्त फ्रीवे के पास है जहां ट्रैफिक का शोर है और पास के हवाई अड्डे के पास पहुंचते ही हवाई जहाज सिर के नीचे से उड़ान भरते हैं। बहुत हवा चल रही है। आपके पीछे वाली कार में स्टीरियो ब्लास्ट हो रहा है और अगली लेन का ग्राहक आपके साथ ही ऑर्डर करने का प्रयास कर रहा है। कोलाहल सबसे अनुभवी मानव आदेश लेने वाले को भी चुनौती देगा।

IBM® watsonx™ ऑर्डर के साथ, हमने मानवीय हस्तक्षेप के बिना ड्राइव-थ्रू ऑर्डर लेने के लिए एक AI-संचालित वॉयस एजेंट बनाया है। उत्पाद शोर की स्थिति में मानव आवाज को अलग करने और समझने के लिए ब्लीडिंग एज तकनीक का उपयोग करता है, साथ ही ऑर्डर देने वाले ग्राहक और वॉयस एजेंट के बीच एक प्राकृतिक, मुक्त-प्रवाह वाली बातचीत का समर्थन करता है।

वॉटसनएक्स ऑर्डर्स भाषण को समझता है और ऑर्डर वितरित करता है

आईबीएम वाटसनएक्स ऑर्डर्स प्रक्रिया तब शुरू करता है जब उसे पता चलता है कि कोई वाहन स्पीकर पोस्ट की ओर आ रहा है। यह ग्राहकों का स्वागत करता है और पूछता है कि वे क्या ऑर्डर करना चाहते हैं। इसके बाद यह आने वाले ऑडियो को सुनता है और मानव आवाज को अलग करता है। उससे, यह ऑर्डर और आइटम का पता लगाता है, फिर ग्राहक को दिखाता है कि उसने डिजिटल मेनू बोर्ड पर क्या सुना। यदि ग्राहक कहता है कि सब कुछ ठीक लग रहा है, तो वॉटसनएक्स ऑर्डर्स ऑर्डर को बिक्री स्थल और रसोई में भेज देता है। अंत में, रसोई भोजन तैयार करती है। पूरी ऑर्डर प्रक्रिया नीचे दिए गए चित्र में दिखाई गई है:

ग्राहक के ऑर्डर को समझने के तीन भाग हैं। पहला भाग मानवीय आवाज को अलग करना और परस्पर विरोधी पर्यावरणीय ध्वनियों को नजरअंदाज करना है। दूसरा भाग भाषण को समझना है, जिसमें उच्चारण, बोलचाल की भाषा, भावनाओं और गलत बयानों की जटिलता शामिल है। अंत में, तीसरा भाग भाषण डेटा को एक ऐसी कार्रवाई में अनुवादित कर रहा है जो ग्राहक के इरादे को दर्शाता है।

मानवीय आवाज को अलग करना

जब आप अपने बैंक या यूटिलिटीज कंपनी को कॉल करते हैं, तो एक वॉयस एजेंट चैटबॉट संभवतः सबसे पहले कॉल का जवाब देता है और पूछता है कि आप क्यों कॉल कर रहे हैं। वह चैटबॉट किसी फ़ोन से अपेक्षाकृत शांत ऑडियो की अपेक्षा कर रहा है जिसमें पृष्ठभूमि शोर बहुत कम या बिल्कुल नहीं होगा।

ड्राइव-थ्रू में, पृष्ठभूमि शोर हमेशा रहेगा। इससे कोई फर्क नहीं पड़ता कि ऑडियो हार्डवेयर कितना अच्छा है, मानवीय आवाजें तेज़ शोर से दब सकती हैं, जैसे कि गुजरती ट्रेन का हॉर्न।

चूंकि वाटसनएक्स ऑर्डर वास्तविक समय में ऑडियो कैप्चर करता है, यह डिजिटल शोर और इको रद्दीकरण करने के लिए मशीन-लर्निंग तकनीकों का उपयोग करता है। यह हवा, बारिश, राजमार्ग यातायात और हवाई अड्डों के शोर को नजरअंदाज करता है। अन्य शोर चुनौतियों में अप्रत्याशित पृष्ठभूमि शोर और क्रॉस-टॉक शामिल हैं, जहां लोग ऑर्डर के दौरान पृष्ठभूमि में बात कर रहे हैं। वाटसनक्स ऑर्डर्स इन व्यवधानों को कम करने के लिए उन्नत तकनीकों का उपयोग करता है।

वाणी को समझना

अधिकांश वॉयस चैटबॉट टेक्स्ट चैटबॉट के रूप में शुरू हुए। पारंपरिक वॉयस एजेंट पहले बोले गए शब्दों को लिखित पाठ में बदलते हैं, फिर वे यह पता लगाने के लिए लिखित वाक्य का विश्लेषण करते हैं कि वक्ता क्या चाहता है।

यह कम्प्यूटेशनल रूप से धीमा और बेकार है। पहले ध्वनियों को शब्दों और वाक्यों में बदलने की कोशिश करने के बजाय, वॉटसनक्स ऑर्डर्स भाषण को स्वरों में बदल देता है (भाषण में ध्वनि की सबसे छोटी इकाइयाँ जो एक अलग अर्थ बताती हैं)। उदाहरण के लिए, जब आप "हिलाएँ" कहते हैं, तो वॉटसनएक्स ऑर्डर उस शब्द को "श," "ए," और हार्ड "के" में पार्स कर देता है। पूर्ण अंग्रेजी पाठ के बजाय भाषण को स्वरों में परिवर्तित करने से, विभिन्न उच्चारणों पर सटीकता भी बढ़ती है और इंट्रा-डायलॉग विलंबता को कम करके वास्तविक समय वार्तालाप प्रवाह का सक्रिय रूप से समर्थन होता है।

समझ को कार्य में परिणत करना

इसके बाद, वाटसनक्स ऑर्डर्स इरादे की पहचान करता है, जैसे "मैं चाहता हूं" या "उसे रद्द करें"। इसके बाद यह उन आइटमों की पहचान करता है जो "चीज़बर्गर" या "एप्पल पाई" जैसे कमांड से संबंधित हैं।

इरादे की पहचान के लिए कई मशीन लर्निंग तकनीकें हैं। नवीनतम तकनीक आधार और बड़े भाषा मॉडल का उपयोग करती है, जो सैद्धांतिक रूप से किसी भी प्रश्न को समझ सकती है और उचित उत्तर दे सकती है। हार्डवेयर-संयमित उपयोग के मामलों के लिए यह बहुत धीमा और कम्प्यूटेशनल रूप से महंगा है। हालांकि ड्राइव-थ्रू वॉयस एजेंट के लिए यह उत्तर देना प्रभावशाली हो सकता है, "आसमान नीला क्यों है?", यह ड्राइव-थ्रू को धीमा कर देगा, लाइन में लगे लोगों को निराशा होगी और राजस्व में कमी आएगी।

वॉटसनक्स ऑर्डर्स एक अत्यधिक विशिष्ट मॉडल का उपयोग करता है जो उन लाखों तरीकों को समझने के लिए अनुकूलित है जिनसे आप चीज़बर्गर ऑर्डर कर सकते हैं, जैसे "कोई प्याज नहीं, विशेष सॉस पर प्रकाश, या अतिरिक्त टमाटर।" मॉडल ग्राहकों को मध्य-क्रम में मेनू को संशोधित करने की भी अनुमति देता है: "वास्तव में, उस बर्गर पर कोई टमाटर नहीं है।"

उत्पादन में, वॉटसनएक्स ऑर्डर बिना किसी मानवीय हस्तक्षेप के 90% से अधिक ऑर्डर स्वयं पूरा कर सकता है। यह ध्यान देने योग्य है कि जब एआई एजेंट फंस जाता है तो इस क्षेत्र के अन्य विक्रेता मानव ऑपरेटरों के साथ संपर्क केंद्रों का उपयोग करते हैं और वे बातचीत को "स्वचालित" के रूप में गिनते हैं। हमारे IBM watsonx ऑर्डर मानकों के अनुसार, "स्वचालित" का अर्थ है किसी भी इंसान को शामिल किए बिना किसी ऑर्डर को शुरू से अंत तक संभालना।

वास्तविक दुनिया के कार्यान्वयन से मुनाफा बढ़ता है

चरम समय के दौरान, वाटसनक्स ऑर्डर एक दोहरे लेन वाले रेस्तरां में प्रति घंटे 150 से अधिक कारों को संभाल सकता है, जो अधिकांश मानव ऑर्डर लेने वालों से बेहतर है। प्रति घंटे अधिक कारों का मतलब अधिक राजस्व और लाभ है, इसलिए हमारी इंजीनियरिंग और मॉडलिंग दृष्टिकोण इस मीट्रिक के लिए लगातार अनुकूलन कर रहे हैं।

चुनौतीपूर्ण शोर, क्रॉस-टॉक और ऑर्डर जटिलता के बावजूद, वाटसन ऑर्डर्स ने दर्जनों रेस्तरां में 60 मिलियन वास्तविक दुनिया के ऑर्डर लिए हैं। हमने नए मेनू, रेस्तरां प्रौद्योगिकी स्टैक और केंद्रीकृत मेनू प्रबंधन प्रणालियों को आसानी से अनुकूलित करने के लिए मंच का निर्माण किया, इस उम्मीद में कि हम दुनिया भर में हर त्वरित-सेवा रेस्तरां श्रृंखला के साथ काम कर सकते हैं।

सबसे कठिन ऑर्डर को संभालने वाले एआई के साथ अपने रेस्तरां को सुचारू रूप से चालू रखें

क्या यह लेख सहायक था?

हाँनहीं


आर्टिफिशियल इंटेलिजेंस से अधिक




खुदरा प्रौद्योगिकी और अग्रिम पंक्ति के कार्यकर्ता: अविस्मरणीय ग्राहक अनुभव प्रदान करना

2 मिनट लाल - खुदरा उद्योग लाखों लोगों को रोजगार देता है, और अगली पीढ़ी के खुदरा कर्मचारी जेनेरिक एआई के बढ़ने से काफी प्रभावित होंगे। मेरा दृढ़ विश्वास है कि असाधारण ईंट-और-मोर्टार खुदरा, चाहे उत्पाद श्रेणी कोई भी हो, सफलता के लिए तीन आवश्यक स्तंभों पर खड़ा है: गौरवान्वित, अच्छी तरह से प्रशिक्षित, स्पष्ट कैरियर पथ के साथ संलग्न टीम के सदस्य, मजबूत सांस्कृतिक मूल्यों में गहराई से निहित एक ब्रांड बेहतर प्रौद्योगिकी की रीढ़ इनमें से कोई भी तत्व गायब है? जादू होता ही नहीं. आईबीएम दर्ज करें. प्रौद्योगिकी का लाभ उठाने के लिए उनका दृष्टिकोण…




व्यवसाय के लिए सबसे मूल्यवान AI उपयोग के मामले

10 मिनट लाल - कृत्रिम बुद्धिमत्ता (एआई) के उपयोग के मामलों के बारे में सोचते समय, यह प्रश्न पूछा जा सकता है: एआई क्या करने में सक्षम नहीं होगा? इसका आसान उत्तर अधिकतर शारीरिक श्रम है, हालाँकि वह दिन आ सकता है जब अधिकांश शारीरिक श्रम एआई द्वारा नियंत्रित रोबोटिक उपकरणों द्वारा पूरा किया जाएगा। लेकिन अभी, शुद्ध एआई को कई कार्यों के लिए प्रोग्राम किया जा सकता है जिनके लिए विचार और बुद्धि की आवश्यकता होती है, जब तक कि उस बुद्धिमत्ता को डिजिटल रूप से इकट्ठा किया जा सकता है और एआई को प्रशिक्षित करने के लिए उपयोग किया जा सकता है...




आईबीएम टेक नाउ: 12 फरवरी, 2024

<1 मिनट लाल - आईबीएम टेक नाउ में आपका स्वागत है, हमारी वीडियो वेब श्रृंखला प्रौद्योगिकी की दुनिया में नवीनतम और सबसे बड़ी समाचार और घोषणाएं पेश करती है। सुनिश्चित करें कि आपने हर बार कोई नया आईबीएम टेक नाउ वीडियो प्रकाशित होने पर सूचित होने के लिए हमारे यूट्यूब चैनल की सदस्यता ली है। आईबीएम टेक नाउ: एपिसोड 92 इस एपिसोड में, हम निम्नलिखित विषयों को कवर कर रहे हैं: ग्रैमीज़ + आईबीएम वाटसनक्स जेनरेटर एआई के साथ ऑडियो-जैकिंग प्लग इन रहें आप पूरी जानकारी के लिए आईबीएम ब्लॉग घोषणाएं देख सकते हैं...




उद्यम के लिए जेनरेटिव एआई उपयोग के मामले

9 मिनट लाल - याद रखें जब आपने पहली बार अपने हाथ में स्मार्टफोन पकड़ा था तो कितना अच्छा लगा था? कॉम्पैक्ट डिज़ाइन और स्पर्श-आधारित अन्तरक्रियाशीलता भविष्य में एक छलांग की तरह लग रही थी। बहुत पहले, स्मार्टफोन दुनिया भर के संगठनों के लिए जीवन का एक तरीका बन गया क्योंकि वे व्यावसायिक उत्पादकता और संचार के लिए सभी सुविधाएं प्रदान करते हैं। जेनरेटिव एआई (कृत्रिम बुद्धिमत्ता) उत्पादकता में समान छलांग और काम करने और निर्माण के नए तरीकों के उद्भव का वादा करता है। मिडजर्नी और चैटजीपीटी जैसे उपकरण अपनी क्षमताओं के कारण ध्यान आकर्षित कर रहे हैं...

आईबीएम न्यूज़लेटर्स

हमारे न्यूज़लेटर और विषय अपडेट प्राप्त करें जो नवीनतम विचार नेतृत्व और उभरते रुझानों पर अंतर्दृष्टि प्रदान करते हैं।

अभी ग्राहक बनें

अधिक समाचार पत्र

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी