Je gaat naar je favoriete drive-thru om friet en een cheeseburger te pakken. Het is een eenvoudige bestelling en als je naar binnen rijdt, merk je dat er niet echt een rij is. Wat zou er mis kunnen gaan? Veel.
Het restaurant ligt vlak bij een drukke snelweg met brullend verkeerslawaai en vliegtuigen vliegen laag boven hun hoofd als ze de nabijgelegen luchthaven naderen. Het is winderig. In de auto achter je knalt de stereo en de klant op de volgende rijstrook probeert tegelijk met jou te bestellen. De kakofonie zou zelfs de meest ervaren menselijke ordernemer uitdagen.
Met IBM® watsonx™ Orders hebben we een AI-aangedreven stemagent gecreëerd die drive-thru-bestellingen kan aannemen zonder menselijke tussenkomst. Het product maakt gebruik van geavanceerde technologie om de menselijke stem in rumoerige omstandigheden te isoleren en te begrijpen en ondersteunt tegelijkertijd een natuurlijk, vrij vloeiend gesprek tussen de klant die de bestelling plaatst en de stemagent.
Watsonx Orders verstaat spraak en levert bestellingen
IBM Watsonx Orders start het proces wanneer het een voertuig detecteert dat de luidsprekerpost nadert. Hij begroet klanten en vraagt wat ze willen bestellen. Vervolgens luistert het om binnenkomende audio te verwerken en de menselijke stem te isoleren. Van daaruit detecteert het de bestelling en de items en laat de klant vervolgens zien wat hij op het digitale menubord heeft gehoord. Als de klant zegt dat alles er goed uitziet, stuurt watsonx Orders de bestelling naar het verkooppunt en de keuken. Tenslotte bereidt de keuken het eten. Het volledige bestelproces wordt weergegeven in de onderstaande afbeelding:
Er zijn drie onderdelen voor het begrijpen van een klantorder. Het eerste deel is het isoleren van de menselijke stem en het negeren van tegenstrijdige omgevingsgeluiden. Het tweede deel is dan het begrijpen van spraak, inclusief de complexiteit van accenten, spreektaal, emoties en onjuiste uitspraken. Ten slotte vertaalt het derde deel spraakgegevens naar een actie die de intentie van de klant weerspiegelt.
Het isoleren van de menselijke stem
Wanneer u uw bank of nutsbedrijf belt, beantwoordt een voice-agent-chatbot waarschijnlijk eerst de oproep om te vragen waarom u belt. Die chatbot verwacht relatief stille audio van een telefoon met weinig tot geen achtergrondgeluid.
Tijdens de drive-thru zal er altijd achtergrondgeluid zijn. Hoe goed de audiohardware ook is, menselijke stemmen kunnen worden overstemd door harde geluiden, zoals een passerende treinhoorn.
Terwijl Watsonx Orders audio in realtime vastlegt, maakt het gebruik van machinale leertechnieken om digitale ruis- en echo-onderdrukking uit te voeren. Het negeert geluiden van wind, regen, snelwegverkeer en luchthavens. Andere geluidsuitdagingen zijn onverwachte achtergrondgeluiden en overspraak, waarbij mensen tijdens een bestelling op de achtergrond praten. Watsonx Orders maakt gebruik van geavanceerde technieken om deze verstoringen te minimaliseren.
Spraak begrijpen
De meeste voicechatbots zijn begonnen als tekstchatbots. Traditionele stemagenten zetten gesproken woorden eerst om in geschreven tekst en analyseren vervolgens de geschreven zin om erachter te komen wat de spreker wil.
Dit is rekenkundig traag en verspillend. In plaats van eerst te proberen geluiden in woorden en zinnen om te zetten, verandert Watsonx Orders spraak in fonemen (de kleinste geluidseenheden in spraak die een duidelijke betekenis overbrengen). Als u bijvoorbeeld 'shake' zegt, ontleedt watsonx Orders dat woord in 'sh', 'ay' en de harde 'k'. Het omzetten van spraak in fonemen, in plaats van volledige Engelse tekst, verhoogt ook de nauwkeurigheid over verschillende accenten en ondersteunt actief een real-time gespreksstroom door de latentie binnen de dialoog te verminderen.
Begrip vertalen naar actie
Vervolgens identificeert Watsonx Orders de intentie, zoals ‘Ik wil’ of ‘Annuleer dat’. Vervolgens worden de items geïdentificeerd die betrekking hebben op de opdrachten zoals ‘cheeseburger’ of ‘appeltaart’.
Er zijn verschillende machine learning-technieken voor intentieherkenning. De nieuwste techniek maakt gebruik van fundamentele en grote taalmodellen, die theoretisch elke vraag kunnen begrijpen en met een passend antwoord kunnen reageren. Dit is te traag en rekentechnisch duur voor gebruiksscenario's met beperkte hardware. Hoewel het misschien indrukwekkend is als een drive-in-stemagent antwoordt: “Waarom is de lucht blauw?”, zou dit de drive-in vertragen, waardoor de mensen in de rij gefrustreerd raken en de inkomsten dalen.
Watsonx Orders gebruikt een zeer specifiek model dat is geoptimaliseerd om de honderden miljoenen manieren te begrijpen waarop u een cheeseburger kunt bestellen, zoals 'Geen uien, licht op de speciale saus of extra tomaten.' Het model biedt klanten ook de mogelijkheid om halverwege de bestelling het menu aan te passen: “Eigenlijk geen tomaten op die burger.”
Tijdens de productie kan watsonx Orders meer dan 90% van de bestellingen zelf voltooien, zonder enige menselijke tussenkomst. Het is vermeldenswaard dat andere leveranciers in deze ruimte contactcentra met menselijke operators gebruiken om het over te nemen wanneer de AI-agent vastloopt en zij de interactie als ‘geautomatiseerd’ beschouwen. Volgens onze IBM Watsonx Orders-normen betekent 'geautomatiseerd' het end-to-end afhandelen van een bestelling zonder dat er mensen bij betrokken zijn.
Real-world implementatie zorgt voor winst
Tijdens piekuren kan Watsonx Orders meer dan 150 auto's per uur verwerken in een restaurant met twee rijstroken, wat beter is dan de meeste menselijke bestellingen. Meer auto's per uur betekent meer omzet en winst, dus onze engineering- en modelleringsaanpak wordt voortdurend geoptimaliseerd voor deze maatstaf.
Watsonx Orders heeft 60 miljoen echte bestellingen aangenomen in tientallen restaurants, zelfs met uitdagende ruis, overspraak en complexiteit van bestellingen. We hebben het platform zo gebouwd dat het zich gemakkelijk kan aanpassen aan nieuwe menu's, restauranttechnologie en gecentraliseerde menubeheersystemen, in de hoop dat we met elke snelbedieningsrestaurantketen over de hele wereld kunnen werken.
Zorg ervoor dat uw restaurant soepel blijft draaien met AI die de zwaarste bestellingen afhandelt
Was dit artikel behulpzaam?
JaNee
Meer van Kunstmatige intelligentie
IBM-nieuwsbrieven
Ontvang onze nieuwsbrieven en onderwerpupdates die de nieuwste thought leadership en inzichten over opkomende trends bieden.
Abonneer nu
Meer nieuwsbrieven
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
- PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
- PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
- Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
- Bron: https://www.ibm.com/blog/unveiling-the-transformative-ai-technology-behind-watsonx-orders/