Zephyrnet-logotyp

Avslöjar den transformativa AI-tekniken bakom watsonx Orders – IBM Blog

Datum:


Avslöjar den transformativa AI-tekniken bakom watsonx Orders – IBM Blog



BBQ-sås som hälls på toppen av en hamburgare med öppet ansikte

Du är på väg till din favorit drive-thru för att ta pommes frites och en cheeseburgare. Det är en enkel beställning och när du drar in märker du att det inte finns mycket av en rad. Vad kan gå fel? Massor.

Restaurangen ligger nära en trafikerad motorväg med brusande trafikljud och flygplan flyger lågt över huvudet när de närmar sig den närliggande flygplatsen. Det är blåsigt. Stereon spränger i bilen bakom dig och kunden i nästa körfält försöker beställa samtidigt som du. Kakofonin skulle utmana även den mest erfarna mänskliga ordertagaren.

Med IBM® watsonx™ Orders har vi skapat en AI-driven röstagent för att ta emot order utan mänsklig inblandning. Produkten använder avancerad teknologi för att isolera och förstå den mänskliga rösten i bullriga förhållanden samtidigt som den stödjer en naturlig, fritt flytande konversation mellan kunden som lägger beställningen och röstagenten.

Watsonx Orders förstår tal och levererar order

IBM watsonx Orders påbörjar processen när den upptäcker ett fordon som drar fram till högtalarstolpen. Den hälsar kunderna välkomna och frågar vad de vill beställa. Den lyssnar sedan på att bearbeta inkommande ljud och isolera den mänskliga rösten. Från det upptäcker den beställningen och varorna och visar sedan kunden vad den hörde på den digitala menykortet. Om kunden säger att allt ser rätt ut skickar watsonx Orders beställningen till försäljningsstället och köket. Till sist lagar köket maten. Hela beställningsprocessen visas i bilden nedan:

Det finns tre delar för att förstå en kundorder. Den första delen är att isolera den mänskliga rösten och ignorera motstridiga miljöljud. Den andra delen är sedan att förstå tal, inklusive komplexiteten i accenter, vardagsspråk, känslor och felaktigheter. Slutligen är den tredje delen att översätta taldata till en handling som speglar kundens avsikt.

Isolera den mänskliga rösten

När du ringer din bank eller ditt elbolag svarar förmodligen en röstagent chatbot på samtalet först för att fråga varför du ringer. Den chatboten förväntar sig relativt tyst ljud från en telefon med lite eller inget bakgrundsljud.

I drive-thru kommer det alltid att finnas bakgrundsljud. Oavsett hur bra ljudhårdvaran är, kan mänskliga röster dränkas av höga ljud, som ett passerande tåghorn.

Eftersom watsonx Orders fångar ljud i realtid använder den maskininlärningstekniker för att utföra digitalt brus och ekodämpning. Den ignorerar ljud från vind, regn, motorvägstrafik och flygplatser. Andra bullerutmaningar inkluderar oväntat bakgrundsljud och överhörning, där människor pratar i bakgrunden under en beställning. Watsonx Orders använder avancerad teknik för att minimera dessa störningar.

Förstå tal

De flesta röstchattbotar började som textchattbotar. Traditionella röstagenter förvandlar först talade ord till skriven text, sedan analyserar de den skrivna meningen för att ta reda på vad talaren vill ha.

Detta är beräkningsmässigt långsamt och slösaktigt. Istället för att först försöka transkribera ljud till ord och meningar, förvandlar watsonx Orders tal till fonem (de minsta ljudenheterna i tal som förmedlar en distinkt betydelse). Till exempel, när du säger "skaka", analyserar watsonx Orders det ordet till "sh", "ay" och hårt "k". Att konvertera tal till fonem, istället för full engelsk text, ökar också noggrannheten över olika accenter och stöder aktivt ett konversationsflöde i realtid genom att minska fördröjningen inom dialogrutan.

Att omsätta förståelse till handling

Därefter identifierar watsonx Orders avsikt, till exempel "jag vill" eller "avbryt det". Den identifierar sedan föremålen som hör till kommandona som "ostburgare" eller "äppelpaj".

Det finns flera maskininlärningstekniker för avsiktsigenkänning. Den senaste tekniken använder grundläggande och stora språkmodeller, som teoretiskt sett kan förstå alla frågor och svara med ett lämpligt svar. Detta är för långsamt och beräkningsmässigt dyrt för hårdvarubegränsade användningsfall. Även om det kan vara imponerande för en drive-thru-röstagent att svara, "Varför är himlen blå?", skulle det sakta ner körningen, frustrera folket i kö och minska intäkterna.

Watsonx Orders använder en mycket specifik modell som är optimerad för att förstå de hundratals miljoner sätt som du kan beställa en cheeseburgare, till exempel "Ingen lök, lätt på specialsåsen eller extra tomater." Modellen tillåter också kunder att ändra menyn mitt i ordningen: "Faktiskt inga tomater på den hamburgaren."

I produktionen kan watsonx Orders slutföra mer än 90 % av beställningarna på egen hand utan mänsklig inblandning. Det är värt att notera att andra leverantörer i det här utrymmet använder kontaktcenter med mänskliga operatörer för att ta över när AI-agenten fastnar och de räknar interaktionen som "automatiserad". Enligt våra IBM watsonx Orders-standarder betyder "automatiserad" att hantera en order från början till slut utan att några människor är inblandade.

Implementering i verkligheten leder till vinst

Under rusningstider kan watsonx Orders hantera mer än 150 bilar per timme i en restaurang med två körfält, vilket är bättre än de flesta mänskliga ordertagare. Fler bilar per timme betyder mer intäkter och vinst, så våra teknik- och modelleringsstrategier optimerar ständigt för detta mått.

Watsonx Orders har tagit 60 miljoner verkliga beställningar i dussintals restauranger, även med utmanande buller, korshörning och beställningskomplexitet. Vi byggde plattformen för att enkelt anpassa oss till nya menyer, restaurangteknologistaplar och centraliserade menyhanteringssystem i hopp om att vi kan arbeta med alla snabbserverade restaurangkedjor över hela världen.

Håll din restaurang igång smidigt med AI som hanterar de tuffaste beställningarna

var den här artikeln hjälpsam?

JaNej


Mer från artificiell intelligens




Detaljhandelsteknik och frontlinjearbetare: Leverera oförglömliga kundupplevelser

2 min läs - Detaljhandeln sysselsätter miljontals människor, och nästa generations detaljhandelsanställda kommer att påverkas avsevärt av framväxten av generativ AI. Jag är övertygad om att exceptionell fysisk detaljhandel, oavsett produktkategori, står på tre viktiga pelare för framgång: Stolta, välutbildade, engagerade teammedlemmar med tydliga karriärvägar Ett varumärke som är djupt rotat i starka kulturella värderingar En ryggrad av överlägsen teknik Saknar du något av dessa element? Magin händer helt enkelt inte. Ange IBM. Deras inställning till att utnyttja teknik...




De mest värdefulla AI-användningsfallen för företag

10 min läs - När man tänker på användningsfall med artificiell intelligens (AI) kan frågan ställas: Vad kommer inte AI att kunna göra? Det enkla svaret är mestadels manuellt arbete, även om dagen kan komma då mycket av det som nu är manuellt arbete kommer att utföras av robotenheter som styrs av AI. Men just nu kan ren AI programmeras för många uppgifter som kräver eftertanke och intelligens, så länge den intelligensen kan samlas in digitalt och användas för att träna en AI...




IBM Tech Now: 12 februari 2024

<1 min läs - ​Välkommen IBM Tech Now, vår videowebbserie med de senaste och bästa nyheterna och tillkännagivandena inom teknikvärlden. Se till att du prenumererar på vår YouTube-kanal för att bli meddelad varje gång en ny IBM Tech Now-video publiceras. IBM Tech Now: Avsnitt 92 I det här avsnittet tar vi upp följande ämnen: GRAMMYs + IBM watsonx Audio-jacking med generativ AI Håll dig inkopplad Du kan kolla in IBM Blog Announcements för en fullständig genomgång av...




Generativa AI-användningsfall för företaget

9 min läs - Kommer du ihåg hur coolt det kändes när du först höll en smartphone i handen? Den kompakta designen och beröringsbaserade interaktiviteten verkade som ett språng in i framtiden. Snart blev smartphones ett sätt att leva för organisationer över hela världen på grund av allt de erbjuder för företagsproduktivitet och kommunikation. Generativ AI (artificiell intelligens) lovar ett liknande steg i produktivitet och uppkomsten av nya arbetssätt och skapande. Verktyg som Midjourney och ChatGPT får uppmärksamhet för sina möjligheter...

IBMs nyhetsbrev

Få våra nyhetsbrev och ämnesuppdateringar som ger det senaste tankeledarskapet och insikter om nya trender.

Prenumerera nu

Fler nyhetsbrev

plats_img

Senaste intelligens

plats_img