Λογότυπο Zephyrnet

Αποκάλυψη της μετασχηματιστικής τεχνολογίας AI πίσω από τις παραγγελίες watsonx – IBM Blog

Ημερομηνία:


Αποκάλυψη της μετασχηματιστικής τεχνολογίας AI πίσω από τις παραγγελίες watsonx – IBM Blog



Σάλτσα μπάρμπεκιου που χύνεται στην κορυφή ενός μπέργκερ ανοιχτού προσώπου

Κατευθύνεστε στο αγαπημένο σας drive-thru για να πάρετε πατάτες και ένα cheeseburger. Είναι μια απλή παραγγελία και καθώς τραβάτε μέσα, παρατηρείτε ότι δεν υπάρχει μεγάλη γραμμή. Τι θα μπορούσε ενδεχομένως να πάει στραβά; Αφθονία.

Το εστιατόριο βρίσκεται κοντά σε έναν πολυσύχναστο αυτοκινητόδρομο με θόρυβο από την κυκλοφορία και τα αεροπλάνα πετούν χαμηλά καθώς πλησιάζουν το κοντινό αεροδρόμιο. Εχει αέρα. Το στερεοφωνικό εκτοξεύεται στο αυτοκίνητο πίσω σας και ο πελάτης στην επόμενη λωρίδα προσπαθεί να παραγγείλει ταυτόχρονα με εσάς. Η κακοφωνία θα προκαλούσε ακόμη και τον πιο έμπειρο άνθρωπο που παραγγέλνει.

Με τις παραγγελίες IBM® watsonx™, δημιουργήσαμε έναν φωνητικό πράκτορα με τεχνητή νοημοσύνη για να λαμβάνουμε παραγγελίες χωρίς ανθρώπινη παρέμβαση. Το προϊόν χρησιμοποιεί τεχνολογία αιχμής για την απομόνωση και την κατανόηση της ανθρώπινης φωνής σε θορυβώδεις συνθήκες ενώ ταυτόχρονα υποστηρίζει μια φυσική, ελεύθερης ροής συνομιλία μεταξύ του πελάτη που κάνει την παραγγελία και του φωνητικού αντιπροσώπου.

Η Watsonx Orders κατανοεί την ομιλία και εκδίδει εντολές

Το IBM watsonx Orders ξεκινά τη διαδικασία όταν ανιχνεύσει ένα όχημα που τραβάει μέχρι τη θέση του ηχείου. Χαιρετίζει τους πελάτες και ρωτά τι θα ήθελαν να παραγγείλουν. Στη συνέχεια ακούει την επεξεργασία του εισερχόμενου ήχου και απομονώνει την ανθρώπινη φωνή. Από αυτό, ανιχνεύει την παραγγελία και τα στοιχεία και, στη συνέχεια, δείχνει στον πελάτη τι άκουσε στον ψηφιακό πίνακα μενού. Εάν ο πελάτης πει ότι όλα φαίνονται σωστά, η watsonx Orders στέλνει την παραγγελία στο σημείο πώλησης και στην κουζίνα. Τέλος, η κουζίνα ετοιμάζει το φαγητό. Η πλήρης διαδικασία παραγγελίας φαίνεται στο παρακάτω σχήμα:

Υπάρχουν τρία μέρη για την κατανόηση μιας παραγγελίας πελάτη. Το πρώτο μέρος είναι η απομόνωση της ανθρώπινης φωνής και η αγνόηση των αντικρουόμενων περιβαλλοντικών ήχων. Το δεύτερο μέρος είναι στη συνέχεια η κατανόηση του λόγου, συμπεριλαμβανομένης της πολυπλοκότητας των προφορών, της καθομιλουμένης, των συναισθημάτων και των ανακριβειών. Τέλος, το τρίτο μέρος μεταφράζει τα δεδομένα ομιλίας σε μια ενέργεια που αντανακλά την πρόθεση του πελάτη.

Απομόνωση της ανθρώπινης φωνής

Όταν καλείτε την τράπεζά σας ή την εταιρεία κοινής ωφέλειας, ένα chatbot φωνητικού αντιπροσώπου πιθανώς απαντά πρώτα στην κλήση για να σας ρωτήσει γιατί καλείτε. Αυτό το chatbot περιμένει σχετικά ήσυχο ήχο από ένα τηλέφωνο με ελάχιστο έως καθόλου θόρυβο στο φόντο.

Στο drive-thru, θα υπάρχει πάντα θόρυβος στο φόντο. Ανεξάρτητα από το πόσο καλό είναι το υλικό ήχου, οι ανθρώπινες φωνές μπορεί να πνιγούν από δυνατούς θορύβους, όπως η κόρνα τρένου που περνάει.

Καθώς το watsonx Orders καταγράφει ήχο σε πραγματικό χρόνο, χρησιμοποιεί τεχνικές μηχανικής εκμάθησης για την εκτέλεση ψηφιακού θορύβου και ακύρωσης ηχούς. Αγνοεί τους θορύβους από τον άνεμο, τη βροχή, την κυκλοφορία στους αυτοκινητόδρομους και τα αεροδρόμια. Άλλες προκλήσεις θορύβου περιλαμβάνουν απροσδόκητο θόρυβο φόντου και διαφωνία, όπου οι άνθρωποι μιλούν στο παρασκήνιο κατά τη διάρκεια μιας παραγγελίας. Η Watsonx Orders χρησιμοποιεί προηγμένες τεχνικές για να ελαχιστοποιήσει αυτές τις διακοπές.

Κατανόηση του λόγου

Τα περισσότερα φωνητικά chatbot ξεκίνησαν ως chatbots κειμένου. Οι παραδοσιακοί φωνητικοί πράκτορες πρώτα μετατρέπουν τις προφορικές λέξεις σε γραπτό κείμενο και μετά αναλύουν τη γραπτή πρόταση για να καταλάβουν τι θέλει ο ομιλητής.

Αυτό είναι υπολογιστικά αργό και σπάταλο. Αντί να προσπαθεί πρώτα να μεταγράψει ήχους σε λέξεις και προτάσεις, το watsonx Orders μετατρέπει την ομιλία σε φωνήματα (οι μικρότερες μονάδες ήχου στην ομιλία που μεταφέρουν ένα ξεχωριστό νόημα). Για παράδειγμα, όταν λέτε "shake", το watsonx Orders αναλύει αυτή τη λέξη σε "sh", "ay" και σκληρό "k". Η μετατροπή της ομιλίας σε φωνήματα, αντί για πλήρες αγγλικό κείμενο, αυξάνει επίσης την ακρίβεια σε διαφορετικούς τόνους και υποστηρίζει ενεργά μια ροή συνομιλίας σε πραγματικό χρόνο μειώνοντας τον λανθάνοντα χρόνο εντός του διαλόγου.

Μετατροπή της κατανόησης σε πράξη

Στη συνέχεια, το watsonx Orders προσδιορίζει την πρόθεση, όπως "θέλω" ή "ακύρωση αυτού". Στη συνέχεια, προσδιορίζει τα στοιχεία που σχετίζονται με τις εντολές όπως "cheeseburger" ή "μηλόπιτα".

Υπάρχουν πολλές τεχνικές μηχανικής εκμάθησης για την αναγνώριση πρόθεσης. Η τελευταία τεχνική χρησιμοποιεί θεμέλια και μεγάλα γλωσσικά μοντέλα, τα οποία θεωρητικά μπορούν να κατανοήσουν οποιαδήποτε ερώτηση και να απαντήσουν με μια κατάλληλη απάντηση. Αυτό είναι πολύ αργό και υπολογιστικά ακριβό για περιπτώσεις χρήσης περιορισμένης χρήσης υλικού. Αν και μπορεί να είναι εντυπωσιακό για έναν φωνητικό πράκτορα να απαντήσει «Γιατί είναι ο ουρανός μπλε;», θα επιβραδύνει τη διέλευση, απογοητεύοντας τους ανθρώπους στην ουρά και μειώνοντας τα έσοδα.

Το Watsonx Orders χρησιμοποιεί ένα εξαιρετικά συγκεκριμένο μοντέλο που είναι βελτιστοποιημένο για να κατανοεί τους εκατοντάδες εκατομμύρια τρόπους με τους οποίους μπορείτε να παραγγείλετε ένα cheeseburger, όπως «Χωρίς κρεμμύδια, ελαφριά στην ειδική σάλτσα ή επιπλέον ντομάτες». Το μοντέλο επιτρέπει επίσης στους πελάτες να τροποποιούν το μενού κατά τη διάρκεια της παραγγελίας: «Στην πραγματικότητα, δεν υπάρχουν ντομάτες σε αυτό το μπιφτέκι».

Στην παραγωγή, η watsonx Orders μπορεί να ολοκληρώσει από μόνη της περισσότερο από το 90% των παραγγελιών χωρίς ανθρώπινη παρέμβαση. Αξίζει να σημειωθεί ότι άλλοι πωλητές σε αυτόν τον χώρο χρησιμοποιούν κέντρα επαφής με ανθρώπινους χειριστές για να αναλάβουν την ευθύνη όταν ο πράκτορας AI κολλήσει και υπολογίζουν την αλληλεπίδραση ως «αυτοματοποιημένη». Σύμφωνα με τα πρότυπα Παραγγελιών της IBM watsonx, «αυτοματοποιημένος» σημαίνει χειρισμός μιας παραγγελίας από άκρο σε άκρο χωρίς τη συμμετοχή ανθρώπων.

Η εφαρμογή σε πραγματικό κόσμο οδηγεί σε κέρδη

Σε περιόδους αιχμής, η watsonx Orders μπορεί να χειριστεί περισσότερα από 150 αυτοκίνητα την ώρα σε ένα εστιατόριο διπλής λωρίδας, κάτι που είναι καλύτερο από τους περισσότερους ανθρώπους που παραδίδουν παραγγελίες. Περισσότερα αυτοκίνητα ανά ώρα σημαίνει περισσότερα έσοδα και κέρδη, επομένως οι προσεγγίσεις μηχανικής και μοντελοποίησης βελτιστοποιούνται συνεχώς για αυτήν τη μέτρηση.

Η Watsonx Orders έχει λάβει 60 εκατομμύρια πραγματικές παραγγελίες σε δεκάδες εστιατόρια, ακόμη και με προκλητικό θόρυβο, διασταυρούμενη συζήτηση και πολυπλοκότητα παραγγελιών. Δημιουργήσαμε την πλατφόρμα για εύκολη προσαρμογή σε νέα μενού, στοίβες τεχνολογίας εστιατορίων και κεντρικά συστήματα διαχείρισης μενού με την ελπίδα ότι μπορούμε να συνεργαστούμε με κάθε αλυσίδα εστιατορίων γρήγορης εξυπηρέτησης σε όλο τον κόσμο.

Διατηρήστε το εστιατόριό σας να λειτουργεί ομαλά με AI που χειρίζεται τις πιο δύσκολες παραγγελίες

Το άρθρο αυτό ήταν χρήσιμο;

ΝαιΟχι


Περισσότερα από την Τεχνητή νοημοσύνη




Τεχνολογία λιανικής και εργαζόμενοι πρώτης γραμμής: Παροχή αξέχαστων εμπειριών στους πελάτες

2 min διαβάστε - Ο κλάδος του λιανικού εμπορίου απασχολεί εκατομμύρια ανθρώπους και οι υπάλληλοι λιανικής επόμενης γενιάς θα επηρεαστούν σημαντικά από την άνοδο της γενετικής τεχνητής νοημοσύνης. Πιστεύω ακράδαντα ότι το εξαιρετικό λιανικό εμπόριο από τούβλα και κονίαμα, ανεξάρτητα από την κατηγορία προϊόντων, βασίζεται σε τρεις βασικούς πυλώνες για την επιτυχία: Περήφανα, καλά εκπαιδευμένα, αφοσιωμένα μέλη της ομάδας με ξεκάθαρα μονοπάτια καριέρας Μια επωνυμία βαθιά ριζωμένη σε ισχυρές πολιτιστικές αξίες Μια ραχοκοκαλιά ανώτερης τεχνολογίας Σας λείπει κάποιο από αυτά τα στοιχεία; Η μαγεία απλά δεν συμβαίνει. Εισαγάγετε την IBM. Η προσέγγισή τους για την αξιοποίηση της τεχνολογίας…




Οι πιο πολύτιμες θήκες χρήσης AI για επιχειρήσεις

10 min διαβάστε - Όταν σκεφτόμαστε περιπτώσεις χρήσης τεχνητής νοημοσύνης (AI), μπορεί να τεθεί το ερώτημα: Τι δεν θα μπορεί να κάνει η τεχνητή νοημοσύνη; Η εύκολη απάντηση είναι ως επί το πλείστον η χειρωνακτική εργασία, αν και μπορεί να έρθει η μέρα που μεγάλο μέρος της χειρωνακτικής εργασίας θα επιτευχθεί με ρομποτικές συσκευές που ελέγχονται από AI. Αλλά αυτή τη στιγμή, η καθαρή τεχνητή νοημοσύνη μπορεί να προγραμματιστεί για πολλές εργασίες που απαιτούν σκέψη και ευφυΐα, αρκεί αυτή η νοημοσύνη να συγκεντρωθεί ψηφιακά και να χρησιμοποιηθεί για την εκπαίδευση ενός AI…




IBM Tech Now: 12 Φεβρουαρίου 2024

<1 min διαβάστε - ​Καλώς ήρθατε στην IBM Tech Now, τη σειρά ιστού βίντεο μας που περιλαμβάνει τα τελευταία και σπουδαιότερα νέα και ανακοινώσεις στον κόσμο της τεχνολογίας. Βεβαιωθείτε ότι έχετε εγγραφεί στο κανάλι μας στο YouTube για να ενημερώνεστε κάθε φορά που δημοσιεύεται ένα νέο βίντεο της IBM Tech Now. IBM Tech Now: Επεισόδιο 92 Σε αυτό το επεισόδιο, καλύπτουμε τα ακόλουθα θέματα: Τα GRAMMYs + IBM watsonx Audio-jacking με γενετική τεχνητή νοημοσύνη.




Παραγωγικές περιπτώσεις χρήσης AI για την επιχείρηση

9 min διαβάστε - Θυμάστε πόσο ωραία νιώσατε όταν κρατήσατε για πρώτη φορά ένα smartphone στο χέρι σας; Η συμπαγής σχεδίαση και η διαδραστικότητα βασισμένη στην αφή έμοιαζαν με ένα άλμα προς το μέλλον. Σύντομα, τα smartphone έγιναν τρόπος ζωής για οργανισμούς σε όλο τον κόσμο, χάρη σε όλα όσα προσφέρουν για την παραγωγικότητα και την επικοινωνία των επιχειρήσεων. Το Generative AI (τεχνητή νοημοσύνη) υπόσχεται ένα παρόμοιο άλμα στην παραγωγικότητα και την εμφάνιση νέων τρόπων εργασίας και δημιουργίας. Εργαλεία όπως το Midjourney και το ChatGPT κερδίζουν την προσοχή για τις δυνατότητές τους…

Ενημερωτικά δελτία IBM

Λάβετε τα ενημερωτικά δελτία μας και τις ενημερώσεις θεμάτων που παρέχουν την πιο πρόσφατη ηγεσία σκέψης και πληροφορίες σχετικά με τις αναδυόμενες τάσεις.

Εγγραφή τώρα

Περισσότερα ενημερωτικά δελτία

spot_img

Τελευταία Νοημοσύνη

spot_img