شعار زيفيرنت

الكشف عن تكنولوجيا الذكاء الاصطناعي التحويلية وراء طلبات Watsonx - مدونة IBM

التاريخ:


الكشف عن تكنولوجيا الذكاء الاصطناعي التحويلية وراء طلبات Watsonx - مدونة IBM



تُسكب صلصة الباربكيو على الجزء العلوي من البرجر المفتوح الوجه

أنت متجه إلى سيارتك المفضلة لتناول البطاطس المقلية والبرجر بالجبن. إنه أمر بسيط وعندما تدخل ستلاحظ أنه لا يوجد الكثير من الخط. ما الذي يمكن أن يحدث بشكل خاطئ؟ كثير.

يقع المطعم بالقرب من طريق سريع مزدحم به ضوضاء مرورية صاخبة وتحلق الطائرات على ارتفاع منخفض عند اقترابها من المطار القريب. الطقس عاصف. ينطلق صوت جهاز الستيريو في السيارة التي خلفك ويحاول العميل الموجود في المسار التالي الطلب في نفس الوقت الذي تقوم فيه بطلب الطعام. سوف يشكل النشاز تحديًا حتى لأكثر الأشخاص خبرة في تنفيذ الأوامر.

باستخدام IBM® watsonx™ Orders، قمنا بإنشاء وكيل صوتي مدعوم بالذكاء الاصطناعي لتلقي الطلبات من السيارة دون تدخل بشري. يستخدم المنتج تقنية متطورة لعزل الصوت البشري وفهمه في الظروف الصاخبة مع دعم المحادثة الطبيعية والتدفق الحر بين العميل الذي يقدم الطلب والوكيل الصوتي في نفس الوقت.

يفهم Watsonx Orders الكلام ويسلم الأوامر

تبدأ طلبات IBM watsonx العملية عندما تكتشف مركبة تتجه نحو عمود السماعة. يرحب بالعملاء ويسألهم عما يرغبون في طلبه. ثم يستمع لمعالجة الصوت الوارد وعزل الصوت البشري. ومن ذلك، يقوم بالكشف عن الطلب والأصناف، ثم يظهر للعميل ما سمعه على لوحة القائمة الرقمية. إذا قال العميل أن كل شيء يبدو على ما يرام، تقوم Watsonx Orders بإرسال الطلب إلى نقطة البيع والمطبخ. وأخيراً يقوم المطبخ بتحضير الطعام. تظهر عملية الطلب الكاملة في الشكل أدناه:

هناك ثلاثة أجزاء لفهم طلب العميل. الجزء الأول هو عزل الصوت البشري وتجاهل الأصوات البيئية المتعارضة. أما الجزء الثاني فهو فهم الكلام، بما في ذلك تعقيد اللهجات والعامية والعواطف والأخطاء. وأخيرًا، الجزء الثالث هو ترجمة بيانات الكلام إلى إجراء يعكس نية العميل.

عزل صوت الإنسان

عندما تتصل بالبنك أو شركة المرافق التي تتعامل معها، فمن المحتمل أن يقوم برنامج الدردشة الآلي للوكيل الصوتي بالرد على المكالمة أولاً ليسألك عن سبب اتصالك. يتوقع برنامج الدردشة الآلي هذا صوتًا هادئًا نسبيًا من الهاتف مع القليل من الضوضاء في الخلفية أو عدم وجودها على الإطلاق.

أثناء القيادة، سيكون هناك دائمًا ضجيج في الخلفية. بغض النظر عن مدى جودة أجهزة الصوت، يمكن أن تحجب الأصوات البشرية الأصوات العالية، مثل بوق القطار العابر.

نظرًا لأن Watsonx Orders يلتقط الصوت في الوقت الفعلي، فإنه يستخدم تقنيات التعلم الآلي لإجراء الضوضاء الرقمية وإلغاء الصدى. يتجاهل الضوضاء الصادرة عن الرياح والأمطار وحركة المرور على الطرق السريعة والمطارات. تشمل تحديات الضوضاء الأخرى الضوضاء غير المتوقعة في الخلفية والتحدث المتبادل، حيث يتحدث الأشخاص في الخلفية أثناء الطلب. تستخدم Watsonx Orders تقنيات متقدمة لتقليل هذه الاضطرابات.

فهم الكلام

بدأت معظم برامج الدردشة الصوتية كبرامج دردشة نصية. يقوم وكلاء الصوت التقليديون أولاً بتحويل الكلمات المنطوقة إلى نص مكتوب، ثم يقومون بتحليل الجملة المكتوبة لمعرفة ما يريده المتحدث.

هذا بطيء حسابيًا ومهدرًا. بدلاً من محاولة نسخ الأصوات أولاً إلى كلمات وجمل، تقوم Watsonx Orders بتحويل الكلام إلى أصوات (أصغر وحدات الصوت في الكلام التي تنقل معنى مميزًا). على سبيل المثال، عندما تقول "shake"، يقوم Watsonx Orders بتحليل هذه الكلمة إلى "sh" و"ay" و"k" الثابت. يؤدي تحويل الكلام إلى مقاطع صوتية، بدلاً من النص الإنجليزي الكامل، إلى زيادة الدقة على اللهجات المختلفة ويدعم بشكل فعال تدفق المحادثة في الوقت الفعلي عن طريق تقليل زمن الوصول للحوار.

ترجمة الفهم إلى عمل

بعد ذلك، تحدد أوامر Watsonx النية، مثل "أريد" أو "إلغاء ذلك". ثم يحدد العناصر التي تتعلق بالأوامر مثل "تشيز برجر" أو "فطيرة التفاح".

هناك العديد من تقنيات التعلم الآلي للتعرف على النوايا. تستخدم أحدث التقنيات نماذج اللغة الأساسية والكبيرة، والتي يمكنها نظريًا فهم أي سؤال والرد عليه بالإجابة المناسبة. وهذا بطيء جدًا ومكلف من الناحية الحسابية بالنسبة لحالات الاستخدام المقيدة بالأجهزة. في حين أنه قد يكون من المثير للإعجاب أن يجيب وكيل الصوت أثناء القيادة، "لماذا السماء زرقاء؟"، إلا أن ذلك قد يؤدي إلى إبطاء القيادة، مما يحبط الأشخاص المتواجدين في الطابور ويقلل الإيرادات.

تستخدم Watsonx Orders نموذجًا محددًا للغاية تم تحسينه لفهم مئات الملايين من الطرق التي يمكنك من خلالها طلب برجر بالجبن، مثل "لا بصل، أو القليل من الصلصة الخاصة، أو طماطم إضافية". كما يسمح النموذج للعملاء بتعديل القائمة في منتصف الترتيب: "في الواقع، لا توجد طماطم على هذا البرجر".

في الإنتاج، يمكن لطلبات Watsonx إكمال أكثر من 90% من الطلبات بنفسها دون أي تدخل بشري. تجدر الإشارة إلى أن البائعين الآخرين في هذا المجال يستخدمون مراكز الاتصال مع المشغلين البشريين لتولي المسؤولية عندما يتعطل وكيل الذكاء الاصطناعي ويعتبرون التفاعل "آليًا". وفقًا لمعايير IBM watsonx Orders الخاصة بنا، فإن كلمة "تلقائية" تعني التعامل مع الطلب من البداية إلى النهاية دون مشاركة أي أشخاص.

التنفيذ في العالم الحقيقي يؤدي إلى تحقيق الأرباح

خلال أوقات الذروة، يمكن لـ Watsonx Orders التعامل مع أكثر من 150 سيارة في الساعة في مطعم مشترك، وهو أفضل من معظم متلقي الطلبات من البشر. المزيد من السيارات في الساعة يعني المزيد من الإيرادات والأرباح، لذلك تعمل أساليبنا الهندسية والنمذجة على تحسين هذا المقياس باستمرار.

تلقت Watsonx Orders 60 مليون طلب حقيقي في عشرات المطاعم، حتى في ظل الضوضاء الصعبة والتداخلات وتعقيد الطلبات. لقد قمنا ببناء النظام الأساسي للتكيف بسهولة مع القوائم الجديدة ومجموعات تكنولوجيا المطاعم وأنظمة إدارة القائمة المركزية على أمل أن نتمكن من العمل مع كل سلسلة مطاعم للخدمة السريعة في جميع أنحاء العالم.

حافظ على تشغيل مطعمك بسلاسة باستخدام الذكاء الاصطناعي الذي يتعامل مع أصعب الطلبات

هل كان المقال مساعدا؟!

نعملا


المزيد من الذكاء الاصطناعي




تكنولوجيا البيع بالتجزئة والعاملون في الخطوط الأمامية: تقديم تجارب لا تنسى للعملاء

2 دقيقة قراءة - توظف صناعة البيع بالتجزئة الملايين من الأشخاص، وسوف يتأثر موظفو التجزئة من الجيل التالي بشكل كبير بظهور الذكاء الاصطناعي التوليدي. أنا مؤمن بشدة بأن البيع بالتجزئة الاستثنائي، بغض النظر عن فئة المنتج، يعتمد على ثلاث ركائز أساسية للنجاح: أعضاء فريق فخورون ومدربون جيدًا وملتزمون بمسارات وظيفية واضحة علامة تجارية متجذرة بعمق في القيم الثقافية القوية العمود الفقري للتكنولوجيا المتفوقة هل تفتقد أيًا من هذه العناصر؟ السحر لا يحدث. أدخل آي بي إم. نهجهم في الاستفادة من التكنولوجيا …




حالات استخدام الذكاء الاصطناعي الأكثر قيمة للأعمال

10 دقيقة قراءة - عند التفكير في حالات استخدام الذكاء الاصطناعي، قد يُطرح السؤال التالي: ما الذي لن يتمكن الذكاء الاصطناعي من فعله؟ الإجابة السهلة هي في الغالب العمل اليدوي، على الرغم من أنه قد يأتي اليوم الذي سيتم فيه إنجاز الكثير من العمل اليدوي الآن بواسطة أجهزة روبوتية يتم التحكم فيها بواسطة الذكاء الاصطناعي. ولكن في الوقت الحالي، يمكن برمجة الذكاء الاصطناعي النقي للعديد من المهام التي تتطلب التفكير والذكاء، طالما أنه يمكن جمع هذا الذكاء رقميًا واستخدامه لتدريب الذكاء الاصطناعي.




IBM Tech Now: 12 فبراير 2024

<1 دقيقة قراءة - مرحبًا بـ IBM Tech Now، سلسلة مقاطع الفيديو الخاصة بنا على الويب والتي تعرض أحدث وأعظم الأخبار والإعلانات في عالم التكنولوجيا. تأكد من الاشتراك في قناتنا على YouTube ليتم إعلامك في كل مرة يتم فيها نشر فيديو IBM Tech Now جديد. IBM Tech Now: الحلقة 92 في هذه الحلقة، نغطي المواضيع التالية: GRAMMYs + IBM watsonx Audio-jacking مع الذكاء الاصطناعي التوليدي ابق على اتصال يمكنك الاطلاع على إعلانات مدونة IBM للحصول على ملخص كامل لـ...




حالات استخدام الذكاء الاصطناعي التوليدي للمؤسسة

9 دقيقة قراءة - هل تتذكر مدى روعة الشعور عندما حملت هاتفًا ذكيًا في يدك لأول مرة؟ بدا التصميم المدمج والتفاعل القائم على اللمس بمثابة قفزة نحو المستقبل. ولم يمض وقت طويل حتى أصبحت الهواتف الذكية أسلوب حياة للمؤسسات في جميع أنحاء العالم بسبب كل ما تقدمه من أجل إنتاجية الأعمال والتواصل. ويَعِد الذكاء الاصطناعي التوليدي (الذكاء الاصطناعي) بقفزة مماثلة في الإنتاجية وظهور أنماط جديدة للعمل والإبداع. أدوات مثل Midjourney وChatGPT تحظى بالاهتمام لقدراتها...

نشرات آي بي إم الإخبارية

احصل على رسائلنا الإخبارية وتحديثات المواضيع التي تقدم أحدث القيادة الفكرية والرؤى حول الاتجاهات الناشئة.

اشترك الآن

المزيد من الرسائل الإخبارية

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة