Zephyrnet-logo

Onthulling van de transformatieve AI-technologie achter watsonx Orders – IBM Blog

Datum:


Onthulling van de transformatieve AI-technologie achter watsonx Orders – IBM Blog



BBQ-saus wordt op de bovenkant van een open burger gegoten

Je gaat naar je favoriete drive-thru om friet en een cheeseburger te pakken. Het is een eenvoudige bestelling en als je naar binnen rijdt, merk je dat er niet echt een rij is. Wat zou er mis kunnen gaan? Veel.

Het restaurant ligt vlak bij een drukke snelweg met brullend verkeerslawaai en vliegtuigen vliegen laag boven hun hoofd als ze de nabijgelegen luchthaven naderen. Het is winderig. In de auto achter je knalt de stereo en de klant op de volgende rijstrook probeert tegelijk met jou te bestellen. De kakofonie zou zelfs de meest ervaren menselijke ordernemer uitdagen.

Met IBM® watsonx™ Orders hebben we een AI-aangedreven stemagent gecreëerd die drive-thru-bestellingen kan aannemen zonder menselijke tussenkomst. Het product maakt gebruik van geavanceerde technologie om de menselijke stem in rumoerige omstandigheden te isoleren en te begrijpen en ondersteunt tegelijkertijd een natuurlijk, vrij vloeiend gesprek tussen de klant die de bestelling plaatst en de stemagent.

Watsonx Orders verstaat spraak en levert bestellingen

IBM Watsonx Orders start het proces wanneer het een voertuig detecteert dat de luidsprekerpost nadert. Hij begroet klanten en vraagt ​​wat ze willen bestellen. Vervolgens luistert het om binnenkomende audio te verwerken en de menselijke stem te isoleren. Van daaruit detecteert het de bestelling en de items en laat de klant vervolgens zien wat hij op het digitale menubord heeft gehoord. Als de klant zegt dat alles er goed uitziet, stuurt watsonx Orders de bestelling naar het verkooppunt en de keuken. Tenslotte bereidt de keuken het eten. Het volledige bestelproces wordt weergegeven in de onderstaande afbeelding:

Er zijn drie onderdelen voor het begrijpen van een klantorder. Het eerste deel is het isoleren van de menselijke stem en het negeren van tegenstrijdige omgevingsgeluiden. Het tweede deel is dan het begrijpen van spraak, inclusief de complexiteit van accenten, spreektaal, emoties en onjuiste uitspraken. Ten slotte vertaalt het derde deel spraakgegevens naar een actie die de intentie van de klant weerspiegelt.

Het isoleren van de menselijke stem

Wanneer u uw bank of nutsbedrijf belt, beantwoordt een voice-agent-chatbot waarschijnlijk eerst de oproep om te vragen waarom u belt. Die chatbot verwacht relatief stille audio van een telefoon met weinig tot geen achtergrondgeluid.

Tijdens de drive-thru zal er altijd achtergrondgeluid zijn. Hoe goed de audiohardware ook is, menselijke stemmen kunnen worden overstemd door harde geluiden, zoals een passerende treinhoorn.

Terwijl Watsonx Orders audio in realtime vastlegt, maakt het gebruik van machinale leertechnieken om digitale ruis- en echo-onderdrukking uit te voeren. Het negeert geluiden van wind, regen, snelwegverkeer en luchthavens. Andere geluidsuitdagingen zijn onverwachte achtergrondgeluiden en overspraak, waarbij mensen tijdens een bestelling op de achtergrond praten. Watsonx Orders maakt gebruik van geavanceerde technieken om deze verstoringen te minimaliseren.

Spraak begrijpen

De meeste voicechatbots zijn begonnen als tekstchatbots. Traditionele stemagenten zetten gesproken woorden eerst om in geschreven tekst en analyseren vervolgens de geschreven zin om erachter te komen wat de spreker wil.

Dit is rekenkundig traag en verspillend. In plaats van eerst te proberen geluiden in woorden en zinnen om te zetten, verandert Watsonx Orders spraak in fonemen (de kleinste geluidseenheden in spraak die een duidelijke betekenis overbrengen). Als u bijvoorbeeld 'shake' zegt, ontleedt watsonx Orders dat woord in 'sh', 'ay' en de harde 'k'. Het omzetten van spraak in fonemen, in plaats van volledige Engelse tekst, verhoogt ook de nauwkeurigheid over verschillende accenten en ondersteunt actief een real-time gespreksstroom door de latentie binnen de dialoog te verminderen.

Begrip vertalen naar actie

Vervolgens identificeert Watsonx Orders de intentie, zoals ‘Ik wil’ of ‘Annuleer dat’. Vervolgens worden de items geïdentificeerd die betrekking hebben op de opdrachten zoals ‘cheeseburger’ of ‘appeltaart’.

Er zijn verschillende machine learning-technieken voor intentieherkenning. De nieuwste techniek maakt gebruik van fundamentele en grote taalmodellen, die theoretisch elke vraag kunnen begrijpen en met een passend antwoord kunnen reageren. Dit is te traag en rekentechnisch duur voor gebruiksscenario's met beperkte hardware. Hoewel het misschien indrukwekkend is als een drive-in-stemagent antwoordt: “Waarom is de lucht blauw?”, zou dit de drive-in vertragen, waardoor de mensen in de rij gefrustreerd raken en de inkomsten dalen.

Watsonx Orders gebruikt een zeer specifiek model dat is geoptimaliseerd om de honderden miljoenen manieren te begrijpen waarop u een cheeseburger kunt bestellen, zoals 'Geen uien, licht op de speciale saus of extra tomaten.' Het model biedt klanten ook de mogelijkheid om halverwege de bestelling het menu aan te passen: “Eigenlijk geen tomaten op die burger.”

Tijdens de productie kan watsonx Orders meer dan 90% van de bestellingen zelf voltooien, zonder enige menselijke tussenkomst. Het is vermeldenswaard dat andere leveranciers in deze ruimte contactcentra met menselijke operators gebruiken om het over te nemen wanneer de AI-agent vastloopt en zij de interactie als ‘geautomatiseerd’ beschouwen. Volgens onze IBM Watsonx Orders-normen betekent 'geautomatiseerd' het end-to-end afhandelen van een bestelling zonder dat er mensen bij betrokken zijn.

Real-world implementatie zorgt voor winst

Tijdens piekuren kan Watsonx Orders meer dan 150 auto's per uur verwerken in een restaurant met twee rijstroken, wat beter is dan de meeste menselijke bestellingen. Meer auto's per uur betekent meer omzet en winst, dus onze engineering- en modelleringsaanpak wordt voortdurend geoptimaliseerd voor deze maatstaf.

Watsonx Orders heeft 60 miljoen echte bestellingen aangenomen in tientallen restaurants, zelfs met uitdagende ruis, overspraak en complexiteit van bestellingen. We hebben het platform zo gebouwd dat het zich gemakkelijk kan aanpassen aan nieuwe menu's, restauranttechnologie en gecentraliseerde menubeheersystemen, in de hoop dat we met elke snelbedieningsrestaurantketen over de hele wereld kunnen werken.

Zorg ervoor dat uw restaurant soepel blijft draaien met AI die de zwaarste bestellingen afhandelt

Was dit artikel behulpzaam?

JaNee


Meer van Kunstmatige intelligentie




Retailtechnologie en eerstelijnswerkers: onvergetelijke klantervaringen bieden

2 min gelezen - De detailhandel biedt werk aan miljoenen mensen, en werknemers van de volgende generatie in de detailhandel zullen aanzienlijk worden beïnvloed door de opkomst van generatieve AI. Ik ben er vast van overtuigd dat uitzonderlijke fysieke retail, ongeacht de productcategorie, op drie essentiële pijlers voor succes rust: Trotse, goed opgeleide, betrokken teamleden met duidelijke carrièrepaden Een merk dat diep geworteld is in sterke culturele waarden Een ruggengraat van superieure technologie. Ontbreekt een van deze elementen? De magie gebeurt gewoon niet. Voer IBM in. Hun benadering van het benutten van technologie...




De meest waardevolle AI-use cases voor het bedrijfsleven

10 min gelezen - Wanneer we nadenken over gebruiksscenario's voor kunstmatige intelligentie (AI), kan de vraag worden gesteld: wat kan AI niet doen? Het makkelijke antwoord is meestal handarbeid, hoewel er ooit een dag zou kunnen komen waarop veel van wat nu handarbeid is, zal worden uitgevoerd door robotapparatuur die wordt bestuurd door AI. Maar op dit moment kan pure AI worden geprogrammeerd voor veel taken die denkvermogen en intelligentie vereisen, zolang die intelligentie maar digitaal kan worden verzameld en gebruikt om een ​​AI te trainen...




IBM Tech Now: 12 februari 2024

<1 min gelezen - Welkom IBM Tech Now, onze videowebserie met het laatste en beste nieuws en aankondigingen in de wereld van technologie. Zorg ervoor dat u zich abonneert op ons YouTube-kanaal, zodat u op de hoogte wordt gehouden telkens wanneer er een nieuwe IBM Tech Now-video wordt gepubliceerd. IBM Tech Now: aflevering 92 In deze aflevering behandelen we de volgende onderwerpen: De GRAMMY's + IBM watsonx Audio-jacking met generatieve AI Blijf aangesloten Je kunt de IBM Blog-aankondigingen bekijken voor een volledig overzicht van...




Generatieve AI-gebruiksscenario's voor de onderneming

9 min gelezen - Weet je nog hoe cool het voelde toen je voor het eerst een smartphone in je hand hield? Het compacte ontwerp en de op aanraking gebaseerde interactiviteit leken een sprong in de toekomst. Het duurde niet lang voordat smartphones een manier van leven werden voor organisaties over de hele wereld vanwege alles wat ze te bieden hebben voor zakelijke productiviteit en communicatie. Generatieve AI (kunstmatige intelligentie) belooft een soortgelijke sprong in productiviteit en de opkomst van nieuwe manieren van werken en creëren. Tools zoals Midjourney en ChatGPT krijgen steeds meer aandacht vanwege hun mogelijkheden…

IBM-nieuwsbrieven

Ontvang onze nieuwsbrieven en onderwerpupdates die de nieuwste thought leadership en inzichten over opkomende trends bieden.

Abonneer nu

Meer nieuwsbrieven

spot_img

Laatste intelligentie

spot_img