Zephyrnet-Logo

KI-Forschung bei Amazon: Markenstimme, Verschränkungsgrenze, Humorerkennung  

Datum:

Die KI-Forschung bei Amazon im Jahr 2020 brachte Brand Voice hervor, untersuchte die „Verschränkungsgrenze“ des Quantencomputers und versuchte, Humorversuche von Kunden zu modellieren. (Foto von Christian Wiediger auf Unsplash) 

Von John P. Desmond, AI Trends Editor   

Die beliebtesten Artikel, Blog-Beiträge und heruntergeladenen Veröffentlichungen von 2020 wurden auf der Website veröffentlicht Amazon-Wissenschaft Die Website kann als Update zur KI-Arbeit bei Amazon dienen. 

Der beliebteste Artikel des Jahres 2020 war ein Bericht von Fortschritte in der Text-zu-Sprache-Technologie. Der Alexa-Sprachdienst von Amazon ist seit mehr als fünf Jahren auf dem Markt und jetzt auf Hunderten von Millionen Geräten von Amazon und anderen Geräteherstellern verfügbar.   

Fortschritte in der Text-to-Speech-Technologien (TTS) - die Fähigkeit von Computern, Wortfolgen in natürlich klingende, verständliche Audioantworten umzuwandeln - haben es Computern ermöglicht, menschlicher zu klingen. 

Wissenschaftler und Ingenieure von Amazon arbeiten daran, vorherzusagen, wie sich das Gefühl einer Äußerung beispielsweise für einen durchschnittlichen Hörer anhört, und mit menschenähnlichen Intonationen zu reagieren.  

Ein Fortschritt auf diesem Gebiet war 2016 zu verzeichnen, als Forscher von DeepMind, der in London ansässigen KI-Firma von Google, WaveNet einführten, das mithilfe eines neuronalen Netzwerks, das mit Aufzeichnungen realer Sprache trainiert wurde, realistische Stimmen erzeugen konnte.  

Andrew Breen, Senior Manager des TTS-Forschungsteams Amazon

"Diese frühen Untersuchungen deuteten darauf hin, dass eine neue Methode des maschinellen Lernens gleiche oder höhere Qualität und das Potenzial für mehr Flexibilität bietet", erklärte Andrew Breen, Senior Manager des TTS-Forschungsteams in Cambridge, Großbritannien. Breen hat lange an dem Problem gearbeitet, computergestützte Sprache reaktionsfähiger und authentischer zu machen. Bevor er 2018 zu Amazon kam, war er Direktor der TTS-Forschung bei Nuance, einem in Massachusetts ansässigen Unternehmen, das Konversationslösungen für künstliche Intelligenz entwickelt. 

Amazon Polly ist ein Cloud-Dienst von AWS, der Text in gesprochenes Audio konvertiert. Amazon hat kürzlich eine neue Funktion namens Brand Voice angekündigt, mit der Unternehmen mit dem Amazon Polly-Team von KI-Forschern und Linguisten zusammenarbeiten können, um eine exklusive, qualitativ hochwertige neuronale TTS-Stimme zu entwickeln, die die Persönlichkeit ihrer Marke darstellt. Zu den Early Adopters gehört Kentucky Fried Chicken (KFC), in dessen Werbung Colonel Sanders zu sehen ist.   

"Die Möglichkeit für Alexa, ihren Sprechstil an den Kontext einer Kundenanfrage anzupassen, eröffnet die Möglichkeit, neue und reizvolle Erlebnisse zu liefern, die bisher undenkbar waren", erklärte Breen. 

 

Fortschritte bei den Herausforderungen des Quantencomputers  

John Preskill, Physikprofessor, Caltech, Berater der National Quantum Initiative

Zu den Top-Blog-Posts auf Amazon Science im Jahr 2020 gehörte ein Account auf der Herausforderungen des Quantencomputers mit Gedanken von John Preskill, einem Physikprofessor am California Institute of Technology und Berater der National Quantum Initiative, der 2020 als Wissenschaftler zu Amazon kam.   

Ein Quantenbit oder Qubitkann die Werte 0, 1 oder in einem als Überlagerung bekannten Zustand eine Kombination der beiden annehmen. Quantum Computing hängt davon ab, dass sowohl die Überlagerung als auch erhalten bleiben Verschränkung, ein fragiler Zustand, in dem die Quantenzustände der Qubits voneinander abhängig sind.  

Das Ziel von Amazon mit dem AWS Center for Quantum Computing auf dem Caltech-Campus besteht darin, Quantencomputertechnologien zu entwickeln, aufzubauen und in die AWS-Cloud bereitzustellen.  

Auf die Frage, warum Quantencomputer so schwierig sind, erklärte Preskill: „Was es so schwierig macht, ist, dass unsere Hardware gleichzeitig eine Reihe von Kriterien erfüllen soll, die nahezu inkompatibel sind. Einerseits müssen wir die Qubits nahezu perfekt von der Außenwelt isoliert halten. Aber nicht wirklich, weil wir die Berechnung steuern wollen. Schließlich müssen wir die Qubits messen und ihnen sagen können, was zu tun ist. Wir brauchen eine Steuerschaltung, die bestimmt, welchen Algorithmus wir tatsächlich ausführen. “  

Darüber hinaus „wollen wir bei der Berechnung den Zustand erst ganz am Ende betrachten, wenn wir ihn vorlesen. Aber selbst wenn wir es nicht selbst betrachten, betrachtet es die Umwelt. Wenn die Umgebung mit dem Quantensystem interagiert, das die Informationen codiert, die wir verarbeiten, gibt es einen Informationsverlust nach außen, und dies bedeutet eine Störung des Quantenzustands, den wir verarbeiten möchten. “ 

Er fügte hinzu: „Das Wesentliche der Idee ist, dass Sie die Quanteninformationen, wenn Sie sie schützen möchten, auf sehr nichtlokale Weise mithilfe der sogenannten Verschränkung speichern müssen. Das ist natürlich der Ursprung der Magie des Quantencomputers. “ 

Auf die Frage, was der Reiz der Arbeit an einem Projekt ist, dessen Ziel es ist, neue Technologien zu entwickeln, erklärte Preskill: „Dies ist die neue Grenze der Naturwissenschaften, die diese immer komplexeren Systeme vieler Teilchen erforscht, die quantenmechanisch interagieren und sich stark verwickeln. Manchmal nenne ich es die Verschränkungsgrenze. Und ich bin gespannt, was wir über Physik lernen können, wenn wir das erforschen. Ich denke wirklich, dass wir in AWS auf die großen Herausforderungen schauen. “ 

 

Das Modell, dem Computer beizubringen, Humor zu erkennen, ist ernst 

Ein weiterer beliebter Blog-Beitrag zu Amazon Science im Jahr 2020 war beteiligt Computer lehren, Humor zu erkennen. In einem Artikel, der (virtuell) von Hauptautor David Carmel, dem wichtigsten angewandten Wissenschaftler bei Amazon in Haifa, Israel, der diesjährigen Special Interest Group on Information Retrieval (SIGIR) Konferenz der ACM, beschrieben einen neuen Ansatz zur Erkennung von Humor, wenn das System Fragen zu Produkten beantwortet. 

Ein Prozentsatz der Leute versucht lustig zu sein. „Unser System nutzt zwei Erkenntnisse aus der Humortheorie “, so die Autoren,„ Inkongruenz “und„ subjektiver Ton “. Das Team baute ein Modell und versuchte es dann zu trainieren. Fragen zu zugehörigen Produkttiteln wurden aus einer Amazon-Produktseite extrahiert und durch ein „Inkongruenzerkennungsmodul“ geleitet, das sie bewertete. Dann durchliefen sie ein „Subjektivitätsmodul“, das sie ebenfalls bewertete. Dann durchlaufen sie einen Klassifikator, den das Team aufgebaut hat und der versucht herauszufinden, ob die Frage ein Versuch des Humors war.   

Das Team durchlief eine Reihe von Schritten, um Daten zu erstellen, die zum Trainieren des Modells erforderlich sind. "Frühere Untersuchungen haben gezeigt, dass die Verwendung von maschinellem Lernen zum Trainieren von Humorerkennungsmodellen das Risiko einer Domänenverzerrung birgt", so die Autoren. Das Ermöglichen, dass das Modell Produkte erkennt, die zu Comic-Fragen führen, führte zu besseren Ergebnissen bei den ersten Tests.   

"Das Erkennen von Humor ist eine schwierige KI-Herausforderung, aber wenn Sie ihn erfüllen, bleibt der Amazon Store ein Ort, an dem Kunden schnell nützliche Produktinformationen finden und Spaß haben können, während sie dabei sind", so die Autoren. 

Auf dem Amazon-Wissenschaft Website finden Sie im Artikel auf Fortschritte in der Text-zu-Sprache-Technologie, der Blogbeitrag auf der Herausforderungen des Quantencomputers und der Blogbeitrag auf  Computer lehren, Humor zu erkennen. 

Quelle: https://www.aitrends.com/ai-research/ai-research-at-amazon-brand-voice-entanglement-frontier-humor-recognition/

spot_img

Neueste Intelligenz

spot_img

Chat mit uns

Hallo! Wie kann ich dir helfen?