आप फ्राइज़ और चीज़बर्गर लेने के लिए अपने पसंदीदा ड्राइव-थ्रू की ओर जा रहे हैं। यह एक सरल आदेश है और जैसे ही आप अंदर खींचते हैं आप देखते हैं कि वहां कोई अधिक लाइन नहीं है। संभवतः क्या गलती हो सकती है? बहुत।
रेस्तरां एक व्यस्त फ्रीवे के पास है जहां ट्रैफिक का शोर है और पास के हवाई अड्डे के पास पहुंचते ही हवाई जहाज सिर के नीचे से उड़ान भरते हैं। बहुत हवा चल रही है। आपके पीछे वाली कार में स्टीरियो ब्लास्ट हो रहा है और अगली लेन का ग्राहक आपके साथ ही ऑर्डर करने का प्रयास कर रहा है। कोलाहल सबसे अनुभवी मानव आदेश लेने वाले को भी चुनौती देगा।
IBM® watsonx™ ऑर्डर के साथ, हमने मानवीय हस्तक्षेप के बिना ड्राइव-थ्रू ऑर्डर लेने के लिए एक AI-संचालित वॉयस एजेंट बनाया है। उत्पाद शोर की स्थिति में मानव आवाज को अलग करने और समझने के लिए ब्लीडिंग एज तकनीक का उपयोग करता है, साथ ही ऑर्डर देने वाले ग्राहक और वॉयस एजेंट के बीच एक प्राकृतिक, मुक्त-प्रवाह वाली बातचीत का समर्थन करता है।
वॉटसनएक्स ऑर्डर्स भाषण को समझता है और ऑर्डर वितरित करता है
आईबीएम वाटसनएक्स ऑर्डर्स प्रक्रिया तब शुरू करता है जब उसे पता चलता है कि कोई वाहन स्पीकर पोस्ट की ओर आ रहा है। यह ग्राहकों का स्वागत करता है और पूछता है कि वे क्या ऑर्डर करना चाहते हैं। इसके बाद यह आने वाले ऑडियो को सुनता है और मानव आवाज को अलग करता है। उससे, यह ऑर्डर और आइटम का पता लगाता है, फिर ग्राहक को दिखाता है कि उसने डिजिटल मेनू बोर्ड पर क्या सुना। यदि ग्राहक कहता है कि सब कुछ ठीक लग रहा है, तो वॉटसनएक्स ऑर्डर्स ऑर्डर को बिक्री स्थल और रसोई में भेज देता है। अंत में, रसोई भोजन तैयार करती है। पूरी ऑर्डर प्रक्रिया नीचे दिए गए चित्र में दिखाई गई है:
ग्राहक के ऑर्डर को समझने के तीन भाग हैं। पहला भाग मानवीय आवाज को अलग करना और परस्पर विरोधी पर्यावरणीय ध्वनियों को नजरअंदाज करना है। दूसरा भाग भाषण को समझना है, जिसमें उच्चारण, बोलचाल की भाषा, भावनाओं और गलत बयानों की जटिलता शामिल है। अंत में, तीसरा भाग भाषण डेटा को एक ऐसी कार्रवाई में अनुवादित कर रहा है जो ग्राहक के इरादे को दर्शाता है।
मानवीय आवाज को अलग करना
जब आप अपने बैंक या यूटिलिटीज कंपनी को कॉल करते हैं, तो एक वॉयस एजेंट चैटबॉट संभवतः सबसे पहले कॉल का जवाब देता है और पूछता है कि आप क्यों कॉल कर रहे हैं। वह चैटबॉट किसी फ़ोन से अपेक्षाकृत शांत ऑडियो की अपेक्षा कर रहा है जिसमें पृष्ठभूमि शोर बहुत कम या बिल्कुल नहीं होगा।
ड्राइव-थ्रू में, पृष्ठभूमि शोर हमेशा रहेगा। इससे कोई फर्क नहीं पड़ता कि ऑडियो हार्डवेयर कितना अच्छा है, मानवीय आवाजें तेज़ शोर से दब सकती हैं, जैसे कि गुजरती ट्रेन का हॉर्न।
चूंकि वाटसनएक्स ऑर्डर वास्तविक समय में ऑडियो कैप्चर करता है, यह डिजिटल शोर और इको रद्दीकरण करने के लिए मशीन-लर्निंग तकनीकों का उपयोग करता है। यह हवा, बारिश, राजमार्ग यातायात और हवाई अड्डों के शोर को नजरअंदाज करता है। अन्य शोर चुनौतियों में अप्रत्याशित पृष्ठभूमि शोर और क्रॉस-टॉक शामिल हैं, जहां लोग ऑर्डर के दौरान पृष्ठभूमि में बात कर रहे हैं। वाटसनक्स ऑर्डर्स इन व्यवधानों को कम करने के लिए उन्नत तकनीकों का उपयोग करता है।
वाणी को समझना
अधिकांश वॉयस चैटबॉट टेक्स्ट चैटबॉट के रूप में शुरू हुए। पारंपरिक वॉयस एजेंट पहले बोले गए शब्दों को लिखित पाठ में बदलते हैं, फिर वे यह पता लगाने के लिए लिखित वाक्य का विश्लेषण करते हैं कि वक्ता क्या चाहता है।
यह कम्प्यूटेशनल रूप से धीमा और बेकार है। पहले ध्वनियों को शब्दों और वाक्यों में बदलने की कोशिश करने के बजाय, वॉटसनक्स ऑर्डर्स भाषण को स्वरों में बदल देता है (भाषण में ध्वनि की सबसे छोटी इकाइयाँ जो एक अलग अर्थ बताती हैं)। उदाहरण के लिए, जब आप "हिलाएँ" कहते हैं, तो वॉटसनएक्स ऑर्डर उस शब्द को "श," "ए," और हार्ड "के" में पार्स कर देता है। पूर्ण अंग्रेजी पाठ के बजाय भाषण को स्वरों में परिवर्तित करने से, विभिन्न उच्चारणों पर सटीकता भी बढ़ती है और इंट्रा-डायलॉग विलंबता को कम करके वास्तविक समय वार्तालाप प्रवाह का सक्रिय रूप से समर्थन होता है।
समझ को कार्य में परिणत करना
इसके बाद, वाटसनक्स ऑर्डर्स इरादे की पहचान करता है, जैसे "मैं चाहता हूं" या "उसे रद्द करें"। इसके बाद यह उन आइटमों की पहचान करता है जो "चीज़बर्गर" या "एप्पल पाई" जैसे कमांड से संबंधित हैं।
इरादे की पहचान के लिए कई मशीन लर्निंग तकनीकें हैं। नवीनतम तकनीक आधार और बड़े भाषा मॉडल का उपयोग करती है, जो सैद्धांतिक रूप से किसी भी प्रश्न को समझ सकती है और उचित उत्तर दे सकती है। हार्डवेयर-संयमित उपयोग के मामलों के लिए यह बहुत धीमा और कम्प्यूटेशनल रूप से महंगा है। हालांकि ड्राइव-थ्रू वॉयस एजेंट के लिए यह उत्तर देना प्रभावशाली हो सकता है, "आसमान नीला क्यों है?", यह ड्राइव-थ्रू को धीमा कर देगा, लाइन में लगे लोगों को निराशा होगी और राजस्व में कमी आएगी।
वॉटसनक्स ऑर्डर्स एक अत्यधिक विशिष्ट मॉडल का उपयोग करता है जो उन लाखों तरीकों को समझने के लिए अनुकूलित है जिनसे आप चीज़बर्गर ऑर्डर कर सकते हैं, जैसे "कोई प्याज नहीं, विशेष सॉस पर प्रकाश, या अतिरिक्त टमाटर।" मॉडल ग्राहकों को मध्य-क्रम में मेनू को संशोधित करने की भी अनुमति देता है: "वास्तव में, उस बर्गर पर कोई टमाटर नहीं है।"
उत्पादन में, वॉटसनएक्स ऑर्डर बिना किसी मानवीय हस्तक्षेप के 90% से अधिक ऑर्डर स्वयं पूरा कर सकता है। यह ध्यान देने योग्य है कि जब एआई एजेंट फंस जाता है तो इस क्षेत्र के अन्य विक्रेता मानव ऑपरेटरों के साथ संपर्क केंद्रों का उपयोग करते हैं और वे बातचीत को "स्वचालित" के रूप में गिनते हैं। हमारे IBM watsonx ऑर्डर मानकों के अनुसार, "स्वचालित" का अर्थ है किसी भी इंसान को शामिल किए बिना किसी ऑर्डर को शुरू से अंत तक संभालना।
वास्तविक दुनिया के कार्यान्वयन से मुनाफा बढ़ता है
चरम समय के दौरान, वाटसनक्स ऑर्डर एक दोहरे लेन वाले रेस्तरां में प्रति घंटे 150 से अधिक कारों को संभाल सकता है, जो अधिकांश मानव ऑर्डर लेने वालों से बेहतर है। प्रति घंटे अधिक कारों का मतलब अधिक राजस्व और लाभ है, इसलिए हमारी इंजीनियरिंग और मॉडलिंग दृष्टिकोण इस मीट्रिक के लिए लगातार अनुकूलन कर रहे हैं।
चुनौतीपूर्ण शोर, क्रॉस-टॉक और ऑर्डर जटिलता के बावजूद, वाटसन ऑर्डर्स ने दर्जनों रेस्तरां में 60 मिलियन वास्तविक दुनिया के ऑर्डर लिए हैं। हमने नए मेनू, रेस्तरां प्रौद्योगिकी स्टैक और केंद्रीकृत मेनू प्रबंधन प्रणालियों को आसानी से अनुकूलित करने के लिए मंच का निर्माण किया, इस उम्मीद में कि हम दुनिया भर में हर त्वरित-सेवा रेस्तरां श्रृंखला के साथ काम कर सकते हैं।
सबसे कठिन ऑर्डर को संभालने वाले एआई के साथ अपने रेस्तरां को सुचारू रूप से चालू रखें
क्या यह लेख सहायक था?
हाँनहीं
आर्टिफिशियल इंटेलिजेंस से अधिक
आईबीएम न्यूज़लेटर्स
हमारे न्यूज़लेटर और विषय अपडेट प्राप्त करें जो नवीनतम विचार नेतृत्व और उभरते रुझानों पर अंतर्दृष्टि प्रदान करते हैं।
अभी ग्राहक बनें
अधिक समाचार पत्र
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://www.ibm.com/blog/unveiling-the-transformative-ai-technology-behind-watsonx-orders/