Mozilla の共通音声アップデートは、音声ベースの Web ブラウジング用の「Hey Firefox」ウェイクワードのトレーニングに役立ちます

Mozillaは本日、Common Voiceの最新バージョンをリリースしました。これは、スタートアップ、研究者、愛好家が音声対応のアプリ、サービス、デバイスを構築するための書き起こされた音声データのオープンソースコレクションです。 Common Voiceには、7,226の異なる言語で提供された合計54時間以上の音声データが含まれています。 2月2019.

Common Voiceは、音声スニペットだけでなく、話者の年齢、性別、アクセントなど、音声エンジンのトレーニングに役立つ自発的に提供されたメタデータで構成されます。これは、DeepSpeech、オープンソースの音声合成エンジン、音声合成エンジンのスイート、およびMozillaのMachine Learning Groupが管理するトレーニング済みモデルと統合するように設計されています。

Common Voiceで5.5万を超えるクリップを収集するには、多くのレッグワークが必要でした。これは、Common Voice Webサイトのプロンプトを各言語に翻訳する必要があったためです。それでも、5,591時間のうち7,226時間は、これまでにプロジェクトの貢献者によって有効であることが確認されています。また、Mozillaによると、Common Voiceの5,000つの言語（英語、ドイツ語、フランス語、イタリア語、スペイン語）には500以上の固有の話者がいますが、英語、ドイツ語、フランス語、カビル語、カタロニア語、スペイン語、およびキニアルワンダンのXNUMX言語はXNUMX時間を記録しました。

また、本日、特定の目的と使用例のために音声データを収集することを目的とした、Mozillaの最初のデータセットターゲットセグメントがリリースされました。このセグメントには、「ゼロ」から「11,000」までの数字、および「はい」、「いいえ」、「ねえ」、「Firefox」が含まれ、120人が18時間にわたってXNUMXの言語でまとめて話しています。以前にCommon Voiceの製品リーダーであるMegan Branson氏は、「Hey Firefox」のウェイクワードテストに部分的に使用されると述べました。

VB Transform2020オンライン – 15月17〜XNUMX日。主要なAIエグゼクティブに参加：無料のライブストリームに登録する.

「このセグメントデータは、同様のタスクのために、Mozillaがオープンソースの音声認識エンジンであるDeepSpeechの正確さを複数の言語でベンチマークするのに役立ち、データセットの継続的な改善方法に関するより詳細なフィードバックを可能にします。」とBransonはブログ投稿で書いています。「世界中からの寄稿により、[私たちの寄稿者]は、誰でも一般に利用でき、私たちが住んでいる世界を表す音声データセットを作成するという目標を達成するために私たちを支援してくれています。」

Common Voiceの更新は、ディープスピーチこれは、これまでで最速のオープンソース音声認識モデルのXNUMXつを組み込んでいます。最新バージョンのサポートが追加されました TensorFlow Lite、GoogleのTensorFlow機械学習フレームワークのディストリビューションであり、コンピューティングに制約のあるモバイルデバイスや組み込みデバイス向けに最適化されており、起動速度を22倍以上に高めながら、DeepSpeechのメモリ消費量を500倍に削減しました。

Common VoiceとDeepSpeechの両方が、次のようなMozillaプロジェクトに関する作業を通知します。 FirefoxVoice、Firefoxに音声認識サポートを追加するブラウザ拡張。現在、Firefox Voiceは「天気とは」や「Gmailのタブを探す」などのコマンドを理解できますが、目標は、音声のみを使用してWebサイトとの「有意義なやり取り」を促進することです。

生成的データインテリジェンス

Mozilla Common Voiceの更新は、音声ベースのWebブラウジングのための「Hey Firefox」ウェイクワードのトレーニングに役立ちます

ピアソン plc 電子メール警告サービス (18 年 2024 月 XNUMX 日)

アリゾナ州のアパッチジャンクション統一学区が新しい EdTech リソースで革新的な教育と学習をサポート

最新のインテリジェンス

市場はイスラエルの攻撃を単なる威嚇射撃として軽視する一方、石油は赤字に後退する

銀価格予測：XAG/USDは29ドルから序盤上昇した後下落、短期見通しは引き続き堅調

18 年 2024 月 XNUMX 日: Google アラート – LRN

AgriZeroNZ、低排出牧草ソリューションに光を当てるバイオルミクスへの投資

メディア総まとめ – カーボンニュース

金曜日 5: 学習のユニバーサルデザイン

私たちとチャット