ゼファーネットのロゴ

アマゾンでのAI研究:ブランドの声、エンタングルメントフロンティア、ユーモアの認識  

日付:

2020年のAmazonでのAI研究は、ブランドボイスを生み出し、量子コンピューティングの「エンタングルメントフロンティア」を調査し、顧客からのユーモアの試みをモデル化しようとしました。 (UnsplashのChristian Wiedigerによる写真) 

ジョンP.デズモンド、AIトレンドエディター   

で公開された2020年の最も人気のある記事、ブログ投稿、およびダウンロードされた出版物 アマゾンサイエンス ウェブサイトは、AmazonでのAI作業の最新情報として機能します。 

2020年の最も人気のある記事は テキスト読み上げ技術の進歩。 アマゾンのAlexa音声サービスはXNUMX年以上市場に出ており、現在アマゾンや他のデバイスメーカーの何億ものデバイスで利用できます。   

前進 テキスト読み上げ(TTS)テクノロジー(単語のシーケンスを自然な響きのわかりやすい音声応答に変換するコンピューターの機能)により、コンピューターはより人間らしい音を出すことが可能になりました。 

アマゾンの科学者とエンジニアは、たとえば、発話の感情が平均的なリスナーにどのように聞こえるかを予測し、人間のようなイントネーションで応答することに取り組んでいます。  

この分野の進歩は、2016年にロンドンを拠点とするGoogleが所有するAI企業であるDeepMindの研究者が、実際の音声の録音でトレーニングされたニューラルネットワークを使用してリアルな音声を生成できるWaveNetを導入したときに発生しました。  

AmazonのTTSリサーチチームのシニアマネージャー、Andrew Breen

「この初期の調査では、新しい機械学習手法が同等以上の品質と柔軟性の可能性を提供することが示唆されました」と、英国ケンブリッジのTTSリサーチチームのシニアマネージャーであるAndrewBreen氏は述べています。 ブリーンは長い間、コンピューター化された音声をより応答性が高く、本物にするという問題に取り組んできました。 2018年にAmazonに入社する前は、マサチューセッツ州に本拠を置き、会話型人工知能ソリューションを開発しているNuanceのTTSリサーチのディレクターを務めていました。 

Amazon Pollyは、テキストを音声に変換するAWSのクラウドサービスです。 Amazonは最近、ブランドボイスと呼ばれる新機能を発表しました。これは、組織がAI研究科学者および言語学者のAmazon Pollyチームと協力して、ブランドのペルソナを表す排他的で高品質のニューラルTTSボイスを構築する機会を提供します。 アーリーアダプターには、カーネルサンダースを広告に取り上げているケンタッキーフライドチキン(KFC)が含まれます。   

「Alexaが顧客の要求のコンテキストに基づいて彼女の話し方を適応させる能力は、以前は考えられなかった新しい楽しい体験を提供する可能性を開きます」とBreen氏は述べています。 

 

量子コンピューティングの課題に見られる進歩  

ジョン・プレスキル、物理学教授、カリフォルニア工科大学、国立量子イニシアチブの顧問

2020年のAmazonScienceのトップブログ投稿の中には、 量子コンピューティングの課題 カリフォルニア工科大学の物理学教授であり、2020年に学者としてAmazonに加わったNational QuantumInitiativeの顧問であるJohnPreskillの考えを取り入れました。   

量子ビット、または キュービットは、値0、1、または重ね合わせと呼ばれる状態では、XNUMXつの組み合わせをとることができます。 量子コンピューティングは、重ね合わせと エンタングルメント、量子ビットの量子状態が互いに依存している脆弱な状態。  

カリフォルニア工科大学のキャンパスにあるAWSCenter for Quantum ComputingでのAmazonの目標は、量子コンピューティングテクノロジーを開発および構築し、それらをAWSクラウドに提供することです。  

量子コンピューティングが非常に難しい理由を尋ねられたプレスキルは、次のように述べています。「非常に難しいのは、ハードウェアがほぼ互換性のない一連の基準を同時に満たす必要があることです。 一方では、キュービットを外界からほぼ完全に分離しておく必要があります。 しかし、実際にはそうではありません。計算を制御したいからです。 最終的には、キュービットを測定する必要があり、何をすべきかを指示できるようにする必要があります。 実行している実際のアルゴリズムを決定する制御回路が必要になります。」  

さらに、「計算では、状態を読み取る最後の最後まで状態を見たくありません。 しかし、私たち自身がそれを見ていなくても、環境はそれを見ています。 環境が、処理中の情報をエンコードする量子システムと相互作用している場合、外部への情報の漏えいが発生します。これは、処理しようとしている量子状態の乱れを意味します。」 

「このアイデアの本質は、量子情報を保護したい場合、私たちがエンタングルメントと呼ぶものを使用して、非常に非局所的な方法でそれを保存する必要があるということです。 もちろん、これが量子コンピューターの魔法の起源です。」 

Preskill氏は、新しい技術の開発を目標とするプロジェクトに取り組むことの魅力は何であるかを尋ねられ、次のように述べています。 時々私はそれをエンタングルメントフロンティアと呼びます。 そして、それを探求することで物理学について何を学ぶことができるかについて、私は興奮しています。 AWSでは、大きな課題に目を向けていると本当に思います。」 

 

ユーモアを認識するようにコンピューターを教えるモデルは深刻です 

2020年のAmazonScienceに関する別の人気のブログ投稿 ユーモアを認識するようにコンピューターを教える。 イスラエルのハイファにあるAmazonの主任応用科学者である筆頭著者のDavidCarmelが、今年の情報検索に関する特別利益団体に(事実上)発表した論文の中で(シガー)ACMの会議では、システムが製品に関する質問に答えるときのユーモア検出への新しいアプローチについて説明しました。 

ある割合の人は面白くしようとします。 「「私たちのシステムは、ユーモア理論からのXNUMXつの洞察を活用しています」と著者は述べています。それは、「不一致」と「主観的な口調」でした。 チームはモデルを作成し、それをトレーニングしようとしました。 関連する商品タイトルに関する質問は、Amazonの商品ページから抽出され、「不一致検出モジュール」を通過してスコアが付けられました。 次に、彼らは「主観性モジュール」を通過し、それも彼らを採点しました。 次に、チームが作成した分類子を通過し、質問がユーモアの試みであるかどうかを判断しようとします。   

チームは、モデルのトレーニングに必要なデータを生成するために、いくつかの手順を実行しました。 「過去の研究では、機械学習を使用してユーモア認識モデルをトレーニングすると、ドメインバイアスのリスクが生じることが示されています」と著者は述べています。 モデルが漫画の質問を誘う製品を認識できるようにすることで、初期テストの結果が向上しました。   

「ユーモアを認識することは難しいAIの課題ですが、それを満たすことで、Amazon Storeは、顧客が有用な製品情報をすばやく見つけて、そこにいる間に楽しむことができる場所であり続けることができます」と著者は述べています。 

ソフトウェア設定ページで、下図のように アマゾンサイエンス ウェブサイト、上の記事を参照してください テキスト読み上げ技術の進歩、に関するブログ投稿 量子コンピューティングの課題 とのブログ投稿  ユーモアを認識するようにコンピューターを教える。 

出典:https://www.aitrends.com/ai-research/ai-research-at-amazon-brand-voice-entanglement-frontier-humor-recognition/

スポット画像

最新のインテリジェンス

スポット画像