أنت متجه إلى سيارتك المفضلة لتناول البطاطس المقلية والبرجر بالجبن. إنه أمر بسيط وعندما تدخل ستلاحظ أنه لا يوجد الكثير من الخط. ما الذي يمكن أن يحدث بشكل خاطئ؟ كثير.
يقع المطعم بالقرب من طريق سريع مزدحم به ضوضاء مرورية صاخبة وتحلق الطائرات على ارتفاع منخفض عند اقترابها من المطار القريب. الطقس عاصف. ينطلق صوت جهاز الستيريو في السيارة التي خلفك ويحاول العميل الموجود في المسار التالي الطلب في نفس الوقت الذي تقوم فيه بطلب الطعام. سوف يشكل النشاز تحديًا حتى لأكثر الأشخاص خبرة في تنفيذ الأوامر.
باستخدام IBM® watsonx™ Orders، قمنا بإنشاء وكيل صوتي مدعوم بالذكاء الاصطناعي لتلقي الطلبات من السيارة دون تدخل بشري. يستخدم المنتج تقنية متطورة لعزل الصوت البشري وفهمه في الظروف الصاخبة مع دعم المحادثة الطبيعية والتدفق الحر بين العميل الذي يقدم الطلب والوكيل الصوتي في نفس الوقت.
يفهم Watsonx Orders الكلام ويسلم الأوامر
تبدأ طلبات IBM watsonx العملية عندما تكتشف مركبة تتجه نحو عمود السماعة. يرحب بالعملاء ويسألهم عما يرغبون في طلبه. ثم يستمع لمعالجة الصوت الوارد وعزل الصوت البشري. ومن ذلك، يقوم بالكشف عن الطلب والأصناف، ثم يظهر للعميل ما سمعه على لوحة القائمة الرقمية. إذا قال العميل أن كل شيء يبدو على ما يرام، تقوم Watsonx Orders بإرسال الطلب إلى نقطة البيع والمطبخ. وأخيراً يقوم المطبخ بتحضير الطعام. تظهر عملية الطلب الكاملة في الشكل أدناه:
هناك ثلاثة أجزاء لفهم طلب العميل. الجزء الأول هو عزل الصوت البشري وتجاهل الأصوات البيئية المتعارضة. أما الجزء الثاني فهو فهم الكلام، بما في ذلك تعقيد اللهجات والعامية والعواطف والأخطاء. وأخيرًا، الجزء الثالث هو ترجمة بيانات الكلام إلى إجراء يعكس نية العميل.
عزل صوت الإنسان
عندما تتصل بالبنك أو شركة المرافق التي تتعامل معها، فمن المحتمل أن يقوم برنامج الدردشة الآلي للوكيل الصوتي بالرد على المكالمة أولاً ليسألك عن سبب اتصالك. يتوقع برنامج الدردشة الآلي هذا صوتًا هادئًا نسبيًا من الهاتف مع القليل من الضوضاء في الخلفية أو عدم وجودها على الإطلاق.
أثناء القيادة، سيكون هناك دائمًا ضجيج في الخلفية. بغض النظر عن مدى جودة أجهزة الصوت، يمكن أن تحجب الأصوات البشرية الأصوات العالية، مثل بوق القطار العابر.
نظرًا لأن Watsonx Orders يلتقط الصوت في الوقت الفعلي، فإنه يستخدم تقنيات التعلم الآلي لإجراء الضوضاء الرقمية وإلغاء الصدى. يتجاهل الضوضاء الصادرة عن الرياح والأمطار وحركة المرور على الطرق السريعة والمطارات. تشمل تحديات الضوضاء الأخرى الضوضاء غير المتوقعة في الخلفية والتحدث المتبادل، حيث يتحدث الأشخاص في الخلفية أثناء الطلب. تستخدم Watsonx Orders تقنيات متقدمة لتقليل هذه الاضطرابات.
فهم الكلام
بدأت معظم برامج الدردشة الصوتية كبرامج دردشة نصية. يقوم وكلاء الصوت التقليديون أولاً بتحويل الكلمات المنطوقة إلى نص مكتوب، ثم يقومون بتحليل الجملة المكتوبة لمعرفة ما يريده المتحدث.
هذا بطيء حسابيًا ومهدرًا. بدلاً من محاولة نسخ الأصوات أولاً إلى كلمات وجمل، تقوم Watsonx Orders بتحويل الكلام إلى أصوات (أصغر وحدات الصوت في الكلام التي تنقل معنى مميزًا). على سبيل المثال، عندما تقول "shake"، يقوم Watsonx Orders بتحليل هذه الكلمة إلى "sh" و"ay" و"k" الثابت. يؤدي تحويل الكلام إلى مقاطع صوتية، بدلاً من النص الإنجليزي الكامل، إلى زيادة الدقة على اللهجات المختلفة ويدعم بشكل فعال تدفق المحادثة في الوقت الفعلي عن طريق تقليل زمن الوصول للحوار.
ترجمة الفهم إلى عمل
بعد ذلك، تحدد أوامر Watsonx النية، مثل "أريد" أو "إلغاء ذلك". ثم يحدد العناصر التي تتعلق بالأوامر مثل "تشيز برجر" أو "فطيرة التفاح".
هناك العديد من تقنيات التعلم الآلي للتعرف على النوايا. تستخدم أحدث التقنيات نماذج اللغة الأساسية والكبيرة، والتي يمكنها نظريًا فهم أي سؤال والرد عليه بالإجابة المناسبة. وهذا بطيء جدًا ومكلف من الناحية الحسابية بالنسبة لحالات الاستخدام المقيدة بالأجهزة. في حين أنه قد يكون من المثير للإعجاب أن يجيب وكيل الصوت أثناء القيادة، "لماذا السماء زرقاء؟"، إلا أن ذلك قد يؤدي إلى إبطاء القيادة، مما يحبط الأشخاص المتواجدين في الطابور ويقلل الإيرادات.
تستخدم Watsonx Orders نموذجًا محددًا للغاية تم تحسينه لفهم مئات الملايين من الطرق التي يمكنك من خلالها طلب برجر بالجبن، مثل "لا بصل، أو القليل من الصلصة الخاصة، أو طماطم إضافية". كما يسمح النموذج للعملاء بتعديل القائمة في منتصف الترتيب: "في الواقع، لا توجد طماطم على هذا البرجر".
في الإنتاج، يمكن لطلبات Watsonx إكمال أكثر من 90% من الطلبات بنفسها دون أي تدخل بشري. تجدر الإشارة إلى أن البائعين الآخرين في هذا المجال يستخدمون مراكز الاتصال مع المشغلين البشريين لتولي المسؤولية عندما يتعطل وكيل الذكاء الاصطناعي ويعتبرون التفاعل "آليًا". وفقًا لمعايير IBM watsonx Orders الخاصة بنا، فإن كلمة "تلقائية" تعني التعامل مع الطلب من البداية إلى النهاية دون مشاركة أي أشخاص.
التنفيذ في العالم الحقيقي يؤدي إلى تحقيق الأرباح
خلال أوقات الذروة، يمكن لـ Watsonx Orders التعامل مع أكثر من 150 سيارة في الساعة في مطعم مشترك، وهو أفضل من معظم متلقي الطلبات من البشر. المزيد من السيارات في الساعة يعني المزيد من الإيرادات والأرباح، لذلك تعمل أساليبنا الهندسية والنمذجة على تحسين هذا المقياس باستمرار.
تلقت Watsonx Orders 60 مليون طلب حقيقي في عشرات المطاعم، حتى في ظل الضوضاء الصعبة والتداخلات وتعقيد الطلبات. لقد قمنا ببناء النظام الأساسي للتكيف بسهولة مع القوائم الجديدة ومجموعات تكنولوجيا المطاعم وأنظمة إدارة القائمة المركزية على أمل أن نتمكن من العمل مع كل سلسلة مطاعم للخدمة السريعة في جميع أنحاء العالم.
حافظ على تشغيل مطعمك بسلاسة باستخدام الذكاء الاصطناعي الذي يتعامل مع أصعب الطلبات
هل كان المقال مساعدا؟!
نعملا
المزيد من الذكاء الاصطناعي
نشرات آي بي إم الإخبارية
احصل على رسائلنا الإخبارية وتحديثات المواضيع التي تقدم أحدث القيادة الفكرية والرؤى حول الاتجاهات الناشئة.
اشترك الآن
المزيد من الرسائل الإخبارية
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://www.ibm.com/blog/unveiling-the-transformative-ai-technology-behind-watsonx-orders/