ゼファーネットのロゴ

Synamedia が Amazon Rekognition Video を使用して、長編ビデオの高度なビデオ検索機能を構築する方法

日付:

シナメディア は、総合的なソリューション ポートフォリオにより、プレミアム ビデオ サービス プロバイダーと D2C (Direct-to-Consumer) のニーズに対応する主要なビデオ テクノロジー プロバイダーです。 Synamedia ソリューションは、ビデオ ネットワーク、テレビ プラットフォーム、広告と収益化、コンテンツ保護と著作権侵害の阻止など、いくつかの柱に広がっています。

Synamedia は AWS と提携し、人工知能 (AI) を使用して、長編動画の強化された動画検索機能を開発しました。 これは、顧客がアセットのメタデータに記載されていないシーンの説明に基づいてビデオを検索できるようにするためです。 たとえば、メタデータで言及するほど重要ではないボートのシーンを含むビデオ (シリーズ内であっても) を検索します。 これにより、実世界のオブジェクトに基づいたコンテンツの発見が可能になります。

アマゾンレコグニションビデオ、Synamedia は、標準モデルとカスタム モデルを使用して、ビデオと画像でラベル検出を実行できる AI ソリューションを構築しました。 これにより、その時点で実際にシーンにあったものに基づいて、長編ビデオ内の特定のオブジェクトをシーン レベルで検出できるようになりました。 この新しい機能により、ユーザーは探しているものの一般的な説明のみに基づいて、長い形式のビデオ内の特定の出現箇所を見つけることができます。 これにより、Synamedia は新しいコンテンツをオンボーディングする際に非常に高速に実行できるようになり、スピンアップして結果を得るまでに数時間かかるようになりました。 ドメイン固有のイメージ用のカスタム モデルをさらに追加する機能を提供することで、このソリューションは使いやすく、拡張性があります。

「Amazon Rekognition Video は、使いやすく強力なサービスです。 これにより、クラス最高のコンピューター ビジョン機能にすぐにアクセスできるようになりました。これを使用して、革新的なビデオ検索機能を数週間で構築およびテストできました。」

– Synamedia のソフトウェア エンジニアリング フェロー、Avi Fruchter 氏。

AI を使用してビジュアル コンテンツのインデックスを作成する

ビデオ コンテンツの供給と、より優れたビデオ インサイトへの需要の両方が増加し続けるにつれて、効果的なビデオ検索機能がより重要になっています。 ただし、従来のビデオ検索は通常、ビデオ タイトルなどの基本的な情報、または場合によってはビデオの主要なテーマやコンテンツを説明するタグとして添付されたメタデータに限定されます。

ほとんどの説明的な情報は手動で追加する必要がありますが、ビデオの量が増えるにつれて、これは非常に困難になります。 その結果、従来のビデオ検索のパフォーマンスは制限されることがよくあります。 この制限は、作成に費用と時間がかかることを考えると、シーン レベルのメタデータが通常存在しない長い形式のビデオ コンテンツではさらに顕著です。

この制限に対処するために、Synamedia は、コンピューター ビジョンを使用して特定のビデオのシーン レベルの詳細を自動的に識別し、それらのシーンの一般的な説明に基づいてその情報をユーザーが発見できるようにする、AI を活用したビデオ検索ソリューションの開発に着手しました。

Amazon Rekognition を使用して、わずか 2 週間でカスタム コンピュータ ビジョン ソリューションを構築する

この目標を達成するために、Synamedia のソフトウェア エンジニアリング フェローである Avi Fruchter は、 Amazonの再認識 フルマネージドのビデオ分析サービス これは、コンピューター ビジョン モデルを使用して、オブジェクト、アクティビティ、さらにはテキストやシーンなど、関連するシーン レベルの出来事を検出するプロセスを加速するのに役立ちます。

Amazon Rekognition Video は、コンピュータ ビジョン モデルを使用してビデオ コンテンツを自動的に処理およびタグ付けすることにより、ビデオ用のコンピュータ ビジョン ソリューションの開発を加速します。 これらのモデルは、Amazon Rekognition によって完全に管理および維持されます。 これにより、必要なインフラストラクチャを管理するという差別化されていない重労働がなくなり、これらのモデルの構築と展開に必要な技術的専門知識も削減されます。

開始するには、Amazon Rekognition の幅広い機能からタスクに関連するものを選択し、関連する API を呼び出すだけです。 結果は、ジョブごとに管理しやすい JSON 応答として返されます。

たとえば、Synamedia は StartLabelDetection API を使用して、ビデオ ライブラリの各ビデオ フレームで検出されたオブジェクトのラベルのリストを自動的に生成しました。 この単純な API 呼び出しから、Amazon Rekognition はラベルのリスト、それぞれの信頼スコア、および各フレームに関連するタイムスタンプを返しました。 これにより、Synamedia は、テスト ライブラリ内の各ビデオに対してまったく新しい検索メタデータ セットをすぐに作成できるようになりました。 ユーザーは、興味のある特定のオブジェクトや風景を説明するだけで特定のビデオ コンテンツを検索し、クエリに一致するだけでなく、そのコンテンツを取り上げたビデオの特定のシーンを示す結果を取得できます。

ビデオ分析に関連するその他の Amazon Rekognition API には、StartFaceDetection、StartPersonTracking、および StartSegmentDetection があります。これは、ビデオのシーンが変化する瞬間を識別できる機能です。

Amazon Rekognition は、事前に録画されたビデオとライブビデオの両方で動作します。 事前に記録されたビデオが読み込まれます Amazon シンプル ストレージ サービス (Amazon S3)、およびライブビデオはから処理できます AmazonKinesisビデオストリーム.

Synamedia が Amazon Rekognition を選んだのは、機能を迅速に拡張できる能力があるからです。 Synamedia のイノベーション チームは、ビデオで新しい技術革新を構築することに専念しており、強力な技術的専門知識を持っています。 ただし、彼らにとっても、ビデオ テクノロジーのすべての分野で深い専門知識を常に持つことができるとは限りません。 Amazon Rekognition を導入すると、コンピュータ ビジョンの機能が拡張され、ユースケースを概念化し、その実行可能性を迅速にテストできるようになりました。

Avi Fruchter 氏は次のように述べています。 「私たちは常に ML のすべての分野のドメインエキスパートであるとは限りません。Amazon Rekognition により、既存の専門知識を活用して、顧客向けの新しいタイプの強化されたユースケースを実現することができます。」

Synamedia は、彼らのソリューションが、大規模なビデオ ライブラリを持つ企業や、健康や安全上のリスクなど、ライブ ビデオ フィード内の特定のイベントを監視する必要があるますます多くの企業を含む、幅広い顧客に幅広い利益をもたらすと予想しています。

まとめ

Amazon Rekognition Video を使用することで、Synamedia は高度なビデオ検索機能を数週間で構築してテストすることができました。追加の専門的なコンピュータービジョンの専門家を雇ったり開発したりする必要はありませんでした。

この新しい機能により、Synamedia はイノベーション チームの影響力を拡大し、顧客のために新しいビデオ イノベーションを推進するという使命を継続することができます。

ビデオ用の高度なコンピューター ビジョン ソリューションをすばやく構築する方法について詳しくは、次の URL をご覧ください。 アマゾンレコグニションビデオ または参照 Amazon Rekognition のリソース.


著者について

ダニエルバーク AWSのプライベートエクイティグループのAIとMLのヨーロッパのリーダーです。 ダニエルはプライベートエクイティファンドとそのポートフォリオ企業と直接連携し、AIとMLの採用を加速してイノベーションを改善し、企業価値を高めるのを支援しています。

ジョン·ショウ AWS のプライベート エクイティ グループの AI および ML の北米リーダーです。 John は、プライベート エクイティ ファンドおよびそのポートフォリオ企業と直接連携し、AI および ML の導入を加速してイノベーションを改善し、企業価値を高めるのを支援しています。

スポット画像

最新のインテリジェンス

スポット画像