Zephyrnet-Logo

Enthüllung der transformativen KI-Technologie hinter watsonx Orders – IBM Blog

Datum:


Enthüllung der transformativen KI-Technologie hinter watsonx Orders – IBM Blog



BBQ-Sauce wird auf einen offenen Burger gegossen

Sie sind auf dem Weg zu Ihrem Lieblings-Drive-in, um sich Pommes und einen Cheeseburger zu holen. Es ist eine einfache Reihenfolge, und wenn Sie einfahren, bemerken Sie, dass es keine große Linie gibt. Was könnte möglicherweise falsch laufen? Eine Menge.

Das Restaurant liegt in der Nähe einer stark befahrenen Autobahn mit tosendem Verkehrslärm und Flugzeugen, die im Tiefflug auf den nahegelegenen Flughafen zusteuern. Es ist windig. Im Auto hinter Ihnen dröhnt die Stereoanlage, und der Kunde auf der Nebenspur versucht gleichzeitig mit Ihnen zu bestellen. Die Kakophonie würde selbst den erfahrensten menschlichen Befehlshaber herausfordern.

Mit IBM® watsonx™ Orders haben wir einen KI-gestützten Sprachagenten entwickelt, der Drive-Through-Bestellungen ohne menschliches Eingreifen entgegennimmt. Das Produkt nutzt modernste Technologie, um die menschliche Stimme in lauten Umgebungen zu isolieren und zu verstehen und gleichzeitig ein natürliches, fließendes Gespräch zwischen dem Kunden, der die Bestellung aufgibt, und dem Sprachagenten zu unterstützen.

Watsonx Orders versteht Sprache und gibt Befehle aus

IBM watsonx Orders beginnt mit dem Vorgang, wenn es erkennt, dass ein Fahrzeug am Lautsprecherposten vorbeifährt. Es begrüßt den Kunden und fragt ihn, was er bestellen möchte. Anschließend überwacht es die Verarbeitung eingehender Audiodaten und isoliert die menschliche Stimme. Daraus erkennt es die Bestellung und die Artikel und zeigt dem Kunden dann auf der digitalen Menütafel, was er gehört hat. Wenn der Kunde sagt, dass alles in Ordnung ist, sendet watsonx Orders die Bestellung an die Verkaufsstelle und in die Küche. Schließlich bereitet die Küche das Essen zu. Der vollständige Bestellvorgang ist in der folgenden Abbildung dargestellt:

Das Verständnis einer Kundenbestellung besteht aus drei Teilen. Der erste Teil besteht darin, die menschliche Stimme zu isolieren und widersprüchliche Umgebungsgeräusche zu ignorieren. Der zweite Teil besteht dann darin, Sprache zu verstehen, einschließlich der Komplexität von Akzenten, Umgangssprache, Emotionen und falschen Darstellungen. Der dritte Teil schließlich besteht darin, Sprachdaten in eine Aktion umzuwandeln, die die Absicht des Kunden widerspiegelt.

Isolierung der menschlichen Stimme

Wenn Sie Ihre Bank oder Ihr Versorgungsunternehmen anrufen, nimmt wahrscheinlich zuerst ein Sprachagent-Chatbot den Anruf entgegen und fragt Sie, warum Sie anrufen. Dieser Chatbot erwartet von einem Telefon einen relativ leisen Ton mit wenig bis gar keinen Hintergrundgeräuschen.

Bei der Durchfahrt wird es immer Hintergrundgeräusche geben. Unabhängig davon, wie gut die Audio-Hardware ist, können menschliche Stimmen durch laute Geräusche wie die Hupe eines vorbeifahrenden Zuges übertönt werden.

Da watsonx Orders Audio in Echtzeit aufnimmt, nutzt es Techniken des maschinellen Lernens, um eine digitale Rausch- und Echounterdrückung durchzuführen. Es ignoriert Geräusche von Wind, Regen, Straßenverkehr und Flughäfen. Zu weiteren Lärmproblemen zählen unerwartete Hintergrundgeräusche und Übersprechen, bei denen sich Personen während einer Bestellung im Hintergrund unterhalten. Watsonx Orders nutzt fortschrittliche Techniken, um diese Störungen zu minimieren.

Sprache verstehen

Die meisten Sprach-Chatbots begannen als Text-Chatbots. Herkömmliche Sprachagenten wandeln gesprochene Wörter zunächst in geschriebenen Text um und analysieren dann den geschriebenen Satz, um herauszufinden, was der Sprecher möchte.

Dies ist rechenintensiv und verschwenderisch. Anstatt zunächst zu versuchen, Laute in Wörter und Sätze zu transkribieren, wandelt watsonx Orders Sprache in Phoneme um (die kleinsten Lauteinheiten in der Sprache, die eine eindeutige Bedeutung vermitteln). Wenn Sie beispielsweise „shake“ sagen, zerlegt watsonx Orders dieses Wort in „sh“, „ay“ und hartes „k“. Das Umwandeln von Sprache in Phoneme anstelle von vollständigem englischen Text erhöht auch die Genauigkeit bei verschiedenen Akzenten und unterstützt aktiv einen Konversationsfluss in Echtzeit, indem die Latenz innerhalb des Dialogs verringert wird.

Verständnis in Taten umsetzen

Als nächstes identifiziert watsonx Orders die Absicht, wie zum Beispiel „Ich möchte“ oder „das abbrechen“. Anschließend werden die Elemente identifiziert, die sich auf Befehle wie „Cheeseburger“ oder „Apfelkuchen“ beziehen.

Es gibt verschiedene Techniken des maschinellen Lernens zur Absichtserkennung. Die neueste Technik verwendet grundlegende und große Sprachmodelle, die theoretisch jede Frage verstehen und mit einer angemessenen Antwort antworten können. Dies ist für hardwarebeschränkte Anwendungsfälle zu langsam und rechenintensiv. Während es für einen Drive-Through-Voice-Agenten vielleicht beeindruckend wäre, zu antworten: „Warum ist der Himmel blau?“, würde es den Drive-Through verlangsamen, die Leute in der Warteschlange frustrieren und den Umsatz verringern.

Watsonx Orders verwendet ein hochspezifisches Modell, das optimiert ist, um die Hunderte Millionen Möglichkeiten zu verstehen, wie Sie einen Cheeseburger bestellen können, wie zum Beispiel „Keine Zwiebeln, wenig Spezialsauce oder extra Tomaten.“ Das Modell ermöglicht es den Kunden auch, das Menü während der Bestellung zu ändern: „Eigentlich sind auf diesem Burger keine Tomaten.“

In der Produktion kann watsonx Orders mehr als 90 % der Aufträge selbstständig und ohne menschliches Eingreifen erledigen. Es ist erwähnenswert, dass andere Anbieter in diesem Bereich Contact Center mit menschlichen Bedienern nutzen, um zu übernehmen, wenn der KI-Agent nicht weiterkommt, und sie die Interaktion als „automatisiert“ betrachten. Gemäß unseren IBM watsonx Orders-Standards bedeutet „automatisiert“ die durchgängige Abwicklung einer Bestellung ohne menschliche Beteiligung.

Die praktische Umsetzung steigert den Gewinn

Zu Spitzenzeiten kann watsonx Orders in einem zweispurigen Restaurant mehr als 150 Autos pro Stunde abfertigen, was besser ist als die meisten menschlichen Besteller. Mehr Autos pro Stunde bedeuten mehr Umsatz und Gewinn, daher werden unsere Konstruktions- und Modellierungsansätze ständig für diese Kennzahl optimiert.

Watsonx Orders hat 60 Millionen reale Bestellungen in Dutzenden von Restaurants entgegengenommen, selbst bei herausforderndem Lärm, Übersprechen und Komplexität der Bestellung. Wir haben die Plattform so aufgebaut, dass sie sich leicht an neue Menüs, Restaurant-Technologie-Stacks und zentralisierte Menüverwaltungssysteme anpassen lässt, in der Hoffnung, dass wir mit jeder Schnellrestaurantkette auf der ganzen Welt zusammenarbeiten können.

Sorgen Sie für einen reibungslosen Betrieb Ihres Restaurants mit KI, die auch die schwierigsten Bestellungen bearbeitet

War dieser Artikel hilfreich?

JaNein


Mehr von Künstliche Intelligenz




Einzelhandelstechnologie und Mitarbeiter an vorderster Front: Bereitstellung unvergesslicher Kundenerlebnisse

2 min lesen - Der Einzelhandel beschäftigt Millionen von Menschen, und die Einzelhandelsmitarbeiter der nächsten Generation werden vom Aufstieg der generativen KI erheblich betroffen sein. Ich bin fest davon überzeugt, dass herausragender stationärer Einzelhandel, unabhängig von der Produktkategorie, auf drei wesentlichen Säulen des Erfolgs basiert: Stolze, gut ausgebildete, engagierte Teammitglieder mit klaren Karrierewegen. Eine Marke, die tief in starken kulturellen Werten verwurzelt ist Ein Rückgrat überlegener Technologie Fehlt Ihnen eines dieser Elemente? Die Magie passiert einfach nicht. Geben Sie IBM ein. Ihr Ansatz zur Nutzung von Technologie…




Die wertvollsten KI-Anwendungsfälle für Unternehmen

10 min lesen - Wenn man über Anwendungsfälle für künstliche Intelligenz (KI) nachdenkt, stellt sich möglicherweise die Frage: Was wird KI nicht leisten können? Die einfache Antwort ist größtenteils Handarbeit, obwohl der Tag kommen könnte, an dem ein Großteil der heutigen Handarbeit von Robotergeräten erledigt wird, die von KI gesteuert werden. Aber derzeit kann reine KI für viele Aufgaben programmiert werden, die Überlegung und Intelligenz erfordern, solange diese Intelligenz digital gesammelt und zum Trainieren einer KI verwendet werden kann …




IBM Tech Now: 12. Februar 2024

<1 min lesen - ​Willkommen bei IBM Tech Now, unserer Video-Webserie mit den neuesten und besten Neuigkeiten und Ankündigungen aus der Welt der Technologie. Stellen Sie sicher, dass Sie unseren YouTube-Kanal abonnieren, um jedes Mal benachrichtigt zu werden, wenn ein neues IBM Tech Now-Video veröffentlicht wird. IBM Tech Now: Folge 92 In dieser Folge behandeln wir die folgenden Themen: Die GRAMMYs + IBM watsonx Audio-Jacking mit generativer KI Bleiben Sie auf dem Laufenden Eine vollständige Übersicht über … finden Sie in den IBM Blog-Ankündigungen.




Generative KI-Anwendungsfälle für das Unternehmen

9 min lesen - Erinnern Sie sich, wie cool es sich anfühlte, als Sie zum ersten Mal ein Smartphone in der Hand hielten? Das kompakte Design und die berührungsbasierte Interaktivität wirkten wie ein Sprung in die Zukunft. Schon bald wurden Smartphones für Unternehmen auf der ganzen Welt zum Alltag, da sie alles bieten, was die geschäftliche Produktivität und Kommunikation anbelangt. Einen ähnlichen Produktivitätssprung und die Entstehung neuer Arbeits- und Gestaltungsweisen verspricht die generative KI (künstliche Intelligenz). Tools wie Midjourney und ChatGPT gewinnen aufgrund ihrer Fähigkeiten an Aufmerksamkeit …

IBM Newsletter

Erhalten Sie unsere Newsletter und Themenaktualisierungen, die die neuesten Gedanken und Einblicke in neue Trends liefern.

Abonniere jetzt

Weitere Newsletter

spot_img

Neueste Intelligenz

spot_img