あなたはフライドポテトとチーズバーガーを買うためにお気に入りのドライブスルーに向かいます。注文は簡単で、入ってみると、それほど行列ができていないことがわかります。何が問題になる可能性がありますか?多くの。
レストランは、轟音を立てた交通騒音が響く交通量の多い高速道路の近くにあり、近くの空港に近づく飛行機が頭上を低く飛んでいます。風が強いです。後ろの車ではステレオが大音量で鳴り響き、隣の車線の客もあなたと同時に注文しようとしています。この不協和音は、最も経験豊富な人間の注文担当者でも困難を伴うものです。
IBM® watsonx™ Orders を使用して、人間の介入なしでドライブスルー注文を受ける AI を活用した音声エージェントを作成しました。この製品は、最先端のテクノロジーを使用して、騒がしい環境でも人間の声を分離して理解すると同時に、注文する顧客と音声エージェントの間の自然で自由な会話をサポートします。
Watsonx Orders は音声を理解して命令を伝達します
IBM watsonx Orders は、スピーカーポストに停車する車両を検出するとプロセスを開始します。顧客に挨拶し、何を注文したいかを尋ねます。次に、受信音声をリッスンして処理し、人間の声を分離します。そこから注文と品目を検出し、聞いた内容をデジタルメニューボードで顧客に表示します。顧客がすべてが正しいと答えた場合、watsonx Orders は注文を販売時点と厨房に送信します。最後に、キッチンで食事の準備をします。完全な注文プロセスを次の図に示します。
顧客の注文を理解するには 3 つの部分があります。最初の部分は人間の声を分離し、矛盾する環境音を無視します。 2 番目の部分は、アクセント、口語表現、感情、言い間違いなどの複雑さを含む音声を理解することです。最後の 3 番目の部分は、音声データを顧客の意図を反映したアクションに変換することです。
人間の声を分離する
銀行や公共事業会社に電話すると、おそらく音声エージェントのチャットボットが最初に電話に応答し、電話の理由を尋ねます。このチャットボットは、背景ノイズがほとんど、またはまったくない電話からの比較的静かな音声を期待しています。
ドライブスルーでは常に周囲の騒音が発生します。オーディオ ハードウェアがどれほど優れていても、人間の声は通過する電車の警笛などの大きな騒音によってかき消されてしまうことがあります。
watsonx Orders は音声をリアルタイムでキャプチャするため、機械学習技術を使用してデジタル ノイズとエコー キャンセルを実行します。風、雨、高速道路交通、空港からの騒音は無視されます。その他の騒音の問題には、予期せぬ背景騒音や、注文中に人々が背景で話しているクロストークなどがあります。 Watsonx Orders は、高度な技術を使用して、こうした混乱を最小限に抑えます。
音声の理解
ほとんどの音声チャットボットはテキスト チャットボットとして始まりました。従来の音声エージェントは、まず話し言葉を文字テキストに変換し、次にその書かれた文を分析して話者が何を望んでいるのかを把握します。
これは計算が遅く、無駄がかかります。 watsonx Orders は、最初に音声を単語や文章に書き写そうとするのではなく、音声を音素 (音声内の、明確な意味を伝える音声の最小単位) に変換します。たとえば、「シェイク」と言うと、watsonx Orders はその単語を「sh」、「ay」、およびハード「k」に解析します。英語の完全なテキストではなく音声を音素に変換すると、さまざまなアクセントの精度も向上し、対話内の遅延が減少することでリアルタイムの会話フローが積極的にサポートされます。
理解を行動に移す
次に、watsonx Orders は、「欲しい」または「キャンセルしてください」などの意図を識別します。次に、「チーズバーガー」や「アップルパイ」などのコマンドに関連する項目を識別します。
意図認識のための機械学習手法がいくつかあります。最新の技術では、基礎言語モデルと大規模言語モデルを使用しており、理論的にはあらゆる質問を理解し、適切な答えを返すことができます。これは、ハードウェアに制約のあるユースケースにとっては遅すぎ、計算コストが高くつきます。ドライブスルーの音声エージェントが「なぜ空は青いのですか?」と答えるのは印象深いかもしれませんが、ドライブスルーの速度が低下し、列に並んでいる人々をイライラさせ、収益を減少させることになります。
Watsonx Orders は、「玉ねぎなし、特製ソースを軽くかける、またはトマトを多めに」など、チーズバーガーを注文できる何億もの方法を理解するために最適化された、非常に具体的なモデルを使用しています。このモデルでは、顧客が注文の途中でメニューを変更することもできます。「実は、そのハンバーガーにはトマトが入っていないんです」。
実稼働環境では、watsonx Orders は人間の介入なしに、注文の 90% 以上を単独で完了できます。この分野の他のベンダーは、AI エージェントが行き詰まった場合に人間のオペレーターが引き継ぐコンタクト センターを使用しており、そのやり取りを「自動化」しているとみなしていることは注目に値します。 IBM watsonx Orders 標準によると、「自動化」とは、人間が関与せずにエンドツーエンドで注文を処理することを意味します。
現実世界への導入が利益を生み出す
ピーク時には、watsonx Orders は 150 レーンのレストランで XNUMX 時間あたり XNUMX 台以上の車を処理できます。これは、ほとんどの人間の注文担当者よりも優れています。 XNUMX 時間あたりの車両の数が増えるほど、収益と利益が増加することを意味するため、当社のエンジニアリングおよびモデリングのアプローチは、この指標に合わせて常に最適化されています。
Watsonx Orders は、困難な騒音、クロストーク、注文の複雑さにもかかわらず、数十のレストランで 60 万件の実際の注文を受け付けてきました。私たちは、世界中のあらゆるクイック サービス レストラン チェーンと連携できることを期待して、新しいメニュー、レストランのテクノロジー スタック、集中メニュー管理システムに簡単に適応できるプラットフォームを構築しました。
最も難しい注文を処理する AI でレストランをスムーズに運営し続けます
この記事は役に立ちましたか?
有りいいえ
人工知能の詳細
IBM ニュースレター
最新の思想的リーダーシップと新たなトレンドに関する洞察を提供するニュースレターとトピックの最新情報を入手してください。
今すぐ会員登録します。
その他のニュースレター
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.ibm.com/blog/unveiling-the-transformative-ai-technology-behind-watsonx-orders/