Логотип Зефирнет

Представляем революционную технологию искусственного интеллекта, лежащую в основе watsonx Orders – блог IBM

Дата:


Представляем революционную технологию искусственного интеллекта, лежащую в основе watsonx Orders – блог IBM



Соус барбекю выливают на верхнюю часть открытого гамбургера

Вы направляетесь в свой любимый закусочный, чтобы купить картошку фри и чизбургер. Это простой заказ, и когда вы подъезжаете, вы замечаете, что очереди не так уж и много. Что возможно могло пойти не так? Множество.

Ресторан находится рядом с оживленной автострадой, где ревет шум транспорта, а низко над головой пролетают самолеты, приближающиеся к близлежащему аэропорту. Ветрено. В машине позади вас гремит стереосистема, и покупатель на соседней полосе пытается сделать заказ одновременно с вами. Эта какофония бросит вызов даже самому опытному исполнителю заказов.

С помощью IBM® watsonx™ Orders мы создали голосового агента на базе искусственного интеллекта, позволяющего принимать заказы без вмешательства человека. В продукте используется новейшая технология, позволяющая изолировать и понимать человеческий голос в шумных условиях, одновременно поддерживая естественный, свободный разговор между клиентом, размещающим заказ, и голосовым агентом.

Watsonx Orders понимает речь и доставляет приказы

IBM watsonx Orders начинает процесс, когда обнаруживает автомобиль, подъезжающий к стойке громкоговорителя. Он приветствует клиентов и спрашивает, что они хотели бы заказать. Затем он прослушивает, обрабатывает входящий звук и изолирует человеческий голос. На основе этого он определяет заказ и позиции, а затем показывает покупателю то, что он услышал, на цифровой доске меню. Если покупатель говорит, что все в порядке, watsonx Orders отправляет заказ в точку продаж и на кухню. Наконец, кухня готовит еду. Полный процесс заказа показан на рисунке ниже:

Понимание заказа клиента состоит из трех частей. Первая часть — изолировать человеческий голос и игнорировать конфликтующие звуки окружающей среды. Вторая часть — это понимание речи, включая сложность акцентов, разговорных выражений, эмоций и искажений. Наконец, третья часть — это перевод речевых данных в действие, отражающее намерения клиента.

Изолируем человеческий голос

Когда вы звоните в свой банк или коммунальную компанию, чат-бот голосового агента, вероятно, первым ответит на звонок и спросит, почему вы звоните. Этот чат-бот ожидает от телефона относительно тихого звука с минимальным фоновым шумом или вообще без него.

В проезде всегда будет фоновый шум. Независимо от того, насколько хороша звуковая аппаратура, человеческие голоса могут быть заглушены громкими шумами, например гудком проходящего поезда.

Поскольку watsonx Orders записывает звук в реальном времени, он использует методы машинного обучения для подавления цифрового шума и эха. Он игнорирует шумы ветра, дождя, дорожного движения и аэропортов. Другие проблемы с шумом включают неожиданный фоновый шум и перекрестные помехи, когда люди разговаривают на заднем плане во время заказа. Watsonx Orders использует передовые методы для минимизации этих сбоев.

Понимание речи

Большинство голосовых чат-ботов начинались как текстовые чат-боты. Традиционные голосовые агенты сначала преобразуют произнесенные слова в письменный текст, а затем анализируют написанное предложение, чтобы выяснить, чего хочет говорящий.

Это вычислительно медленно и расточительно. Вместо того, чтобы сначала пытаться транскрибировать звуки в слова и предложения, watsonx Orders превращает речь в фонемы (наименьшие звуковые единицы речи, передающие определенное значение). Например, когда вы говорите «встряхнуть», watsonx Orders разбирает это слово на «ш», «ай» и твердый «к». Преобразование речи в фонемы вместо полного текста на английском языке также повышает точность распознавания различных акцентов и активно поддерживает поток разговора в реальном времени за счет уменьшения задержки внутри диалога.

Претворяем понимание в действие

Затем watsonx Orders определяет намерение, например «Я хочу» или «отменить это». Затем он определяет элементы, относящиеся к таким командам, как «чизбургер» или «яблочный пирог».

Существует несколько методов машинного обучения для распознавания намерений. Новейшая методика использует фундаментальные и большие языковые модели, которые теоретически могут понять любой вопрос и дать соответствующий ответ. Это слишком медленно и затратно в вычислительном отношении для случаев использования с аппаратными ограничениями. Ответ голосового агента на вопрос «Почему небо голубое?» может показаться впечатляющим, но это замедлит прохождение, расстроит людей в очереди и снизит доход.

Watsonx Orders использует очень специфическую модель, оптимизированную для понимания сотен миллионов способов заказа чизбургера, таких как «Нет лука, легкий специальный соус или дополнительные помидоры». Модель также позволяет клиентам изменять меню в середине заказа: «На самом деле в этом гамбургере нет помидоров».

В производстве watsonx Orders может выполнять более 90% заказов самостоятельно, без вмешательства человека. Стоит отметить, что другие поставщики в этой области используют контакт-центры с операторами-людьми, чтобы взять на себя управление, когда агент ИИ застревает, и они считают взаимодействие «автоматизированным». Согласно нашим стандартам IBM watsonx Orders, «автоматизированный» означает сквозную обработку заказа без участия человека.

Реальная реализация увеличивает прибыль

В часы пик Watsonx Orders может обрабатывать более 150 автомобилей в час в ресторане с двухполосным движением, что лучше, чем у большинства людей, принимающих заказы. Больше автомобилей в час означает больший доход и прибыль, поэтому наши подходы к проектированию и моделированию постоянно оптимизируются с учетом этого показателя.

Watsonx Orders приняла 60 миллионов реальных заказов в десятках ресторанов, даже несмотря на сильный шум, перекрестные помехи и сложность заказов. Мы создали платформу, позволяющую легко адаптироваться к новым меню, стекам ресторанных технологий и централизованным системам управления меню, в надежде, что мы сможем работать с каждой сетью ресторанов быстрого обслуживания по всему миру.

Обеспечьте бесперебойную работу вашего ресторана с помощью искусственного интеллекта, который обрабатывает самые сложные заказы

Была ли эта статья полезна?

ДаНет


Больше об искусственном интеллекте




Технологии розничной торговли и сотрудники, работающие на переднем крае: обеспечение незабываемого качества обслуживания клиентов

2 мин чтенияВ розничной торговле работают миллионы людей, и развитие генеративного искусственного интеллекта окажет значительное влияние на сотрудников розничной торговли следующего поколения. Я твердо верю, что исключительная розничная торговля, независимо от товарной категории, опирается на три основных столпа успеха: гордые, хорошо обученные, заинтересованные члены команды с ясным карьерным путем; бренд, глубоко укорененный в сильных культурных ценностях. Основа передовых технологий. Не хватает какого-либо из этих элементов? Волшебства просто не происходит. Войдите в IBM. Их подход к использованию технологий…




Наиболее ценные варианты использования ИИ для бизнеса

10 мин чтенияРазмышляя о вариантах использования искусственного интеллекта (ИИ), можно задать вопрос: чего ИИ не сможет сделать? Самый простой ответ — в основном ручной труд, хотя может наступить день, когда большая часть того, что сейчас является ручным трудом, будет выполняться роботизированными устройствами, управляемыми ИИ. Но прямо сейчас чистый ИИ можно запрограммировать для решения многих задач, требующих мышления и интеллекта, при условии, что этот интеллект можно собрать в цифровом виде и использовать для обучения ИИ…




IBM Tech сейчас: 12 февраля 2024 г.

<1 мин чтенияДобро пожаловать в IBM Tech Now, нашу веб-серию видео, в которой представлены самые последние и важные новости и анонсы из мира технологий. Обязательно подпишитесь на наш канал YouTube, чтобы получать уведомления каждый раз, когда публикуется новое видео IBM Tech Now. IBM Tech Now: Эпизод 92. В этом выпуске мы рассматриваем следующие темы: Грэмми + IBM watsonx Аудиоразъем с генеративным искусственным интеллектом. Оставайтесь на связи. Вы можете просмотреть объявления в блоге IBM, чтобы получить полное изложение…




Варианты использования генеративного ИИ на предприятии

9 мин чтенияПомните, как здорово было, когда вы впервые взяли в руки смартфон? Компактный дизайн и сенсорная интерактивность казались прыжком в будущее. Вскоре смартфоны стали образом жизни организаций по всему миру, поскольку они предлагают все возможности для продуктивности бизнеса и общения. Генеративный ИИ (искусственный интеллект) обещает аналогичный скачок в производительности и появление новых способов работы и творчества. Такие инструменты, как Midjourney и ChatGPT, привлекают внимание своими возможностями…

Информационные бюллетени IBM

Получайте наши информационные бюллетени и обновления тем, в которых представлены последние передовые идеи и понимание новых тенденций.

Подписаться

Больше информационных бюллетеней

Spot_img

Последняя разведка

Spot_img