Du är på väg till din favorit drive-thru för att ta pommes frites och en cheeseburgare. Det är en enkel beställning och när du drar in märker du att det inte finns mycket av en rad. Vad kan gå fel? Massor.
Restaurangen ligger nära en trafikerad motorväg med brusande trafikljud och flygplan flyger lågt över huvudet när de närmar sig den närliggande flygplatsen. Det är blåsigt. Stereon spränger i bilen bakom dig och kunden i nästa körfält försöker beställa samtidigt som du. Kakofonin skulle utmana även den mest erfarna mänskliga ordertagaren.
Med IBM® watsonx™ Orders har vi skapat en AI-driven röstagent för att ta emot order utan mänsklig inblandning. Produkten använder avancerad teknologi för att isolera och förstå den mänskliga rösten i bullriga förhållanden samtidigt som den stödjer en naturlig, fritt flytande konversation mellan kunden som lägger beställningen och röstagenten.
Watsonx Orders förstår tal och levererar order
IBM watsonx Orders påbörjar processen när den upptäcker ett fordon som drar fram till högtalarstolpen. Den hälsar kunderna välkomna och frågar vad de vill beställa. Den lyssnar sedan på att bearbeta inkommande ljud och isolera den mänskliga rösten. Från det upptäcker den beställningen och varorna och visar sedan kunden vad den hörde på den digitala menykortet. Om kunden säger att allt ser rätt ut skickar watsonx Orders beställningen till försäljningsstället och köket. Till sist lagar köket maten. Hela beställningsprocessen visas i bilden nedan:
Det finns tre delar för att förstå en kundorder. Den första delen är att isolera den mänskliga rösten och ignorera motstridiga miljöljud. Den andra delen är sedan att förstå tal, inklusive komplexiteten i accenter, vardagsspråk, känslor och felaktigheter. Slutligen är den tredje delen att översätta taldata till en handling som speglar kundens avsikt.
Isolera den mänskliga rösten
När du ringer din bank eller ditt elbolag svarar förmodligen en röstagent chatbot på samtalet först för att fråga varför du ringer. Den chatboten förväntar sig relativt tyst ljud från en telefon med lite eller inget bakgrundsljud.
I drive-thru kommer det alltid att finnas bakgrundsljud. Oavsett hur bra ljudhårdvaran är, kan mänskliga röster dränkas av höga ljud, som ett passerande tåghorn.
Eftersom watsonx Orders fångar ljud i realtid använder den maskininlärningstekniker för att utföra digitalt brus och ekodämpning. Den ignorerar ljud från vind, regn, motorvägstrafik och flygplatser. Andra bullerutmaningar inkluderar oväntat bakgrundsljud och överhörning, där människor pratar i bakgrunden under en beställning. Watsonx Orders använder avancerad teknik för att minimera dessa störningar.
Förstå tal
De flesta röstchattbotar började som textchattbotar. Traditionella röstagenter förvandlar först talade ord till skriven text, sedan analyserar de den skrivna meningen för att ta reda på vad talaren vill ha.
Detta är beräkningsmässigt långsamt och slösaktigt. Istället för att först försöka transkribera ljud till ord och meningar, förvandlar watsonx Orders tal till fonem (de minsta ljudenheterna i tal som förmedlar en distinkt betydelse). Till exempel, när du säger "skaka", analyserar watsonx Orders det ordet till "sh", "ay" och hårt "k". Att konvertera tal till fonem, istället för full engelsk text, ökar också noggrannheten över olika accenter och stöder aktivt ett konversationsflöde i realtid genom att minska fördröjningen inom dialogrutan.
Att omsätta förståelse till handling
Därefter identifierar watsonx Orders avsikt, till exempel "jag vill" eller "avbryt det". Den identifierar sedan föremålen som hör till kommandona som "ostburgare" eller "äppelpaj".
Det finns flera maskininlärningstekniker för avsiktsigenkänning. Den senaste tekniken använder grundläggande och stora språkmodeller, som teoretiskt sett kan förstå alla frågor och svara med ett lämpligt svar. Detta är för långsamt och beräkningsmässigt dyrt för hårdvarubegränsade användningsfall. Även om det kan vara imponerande för en drive-thru-röstagent att svara, "Varför är himlen blå?", skulle det sakta ner körningen, frustrera folket i kö och minska intäkterna.
Watsonx Orders använder en mycket specifik modell som är optimerad för att förstå de hundratals miljoner sätt som du kan beställa en cheeseburgare, till exempel "Ingen lök, lätt på specialsåsen eller extra tomater." Modellen tillåter också kunder att ändra menyn mitt i ordningen: "Faktiskt inga tomater på den hamburgaren."
I produktionen kan watsonx Orders slutföra mer än 90 % av beställningarna på egen hand utan mänsklig inblandning. Det är värt att notera att andra leverantörer i det här utrymmet använder kontaktcenter med mänskliga operatörer för att ta över när AI-agenten fastnar och de räknar interaktionen som "automatiserad". Enligt våra IBM watsonx Orders-standarder betyder "automatiserad" att hantera en order från början till slut utan att några människor är inblandade.
Implementering i verkligheten leder till vinst
Under rusningstider kan watsonx Orders hantera mer än 150 bilar per timme i en restaurang med två körfält, vilket är bättre än de flesta mänskliga ordertagare. Fler bilar per timme betyder mer intäkter och vinst, så våra teknik- och modelleringsstrategier optimerar ständigt för detta mått.
Watsonx Orders har tagit 60 miljoner verkliga beställningar i dussintals restauranger, även med utmanande buller, korshörning och beställningskomplexitet. Vi byggde plattformen för att enkelt anpassa oss till nya menyer, restaurangteknologistaplar och centraliserade menyhanteringssystem i hopp om att vi kan arbeta med alla snabbserverade restaurangkedjor över hela världen.
Håll din restaurang igång smidigt med AI som hanterar de tuffaste beställningarna
var den här artikeln hjälpsam?
JaNej
Mer från artificiell intelligens
IBMs nyhetsbrev
Få våra nyhetsbrev och ämnesuppdateringar som ger det senaste tankeledarskapet och insikter om nya trender.
Prenumerera nu
Fler nyhetsbrev
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
- PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
- Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
- PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
- Källa: https://www.ibm.com/blog/unveiling-the-transformative-ai-technology-behind-watsonx-orders/