ゼファーネットのロゴ

Amazon Rekognition 一括分析とカスタム モデレーションによるコンテンツ モデレーションの改善 |アマゾン ウェブ サービス

日付:

Amazonの再認識 画像やビデオの分析をアプリケーションに簡単に追加できます。これは、Amazon のコンピューター ビジョン科学者が毎日何十億もの画像とビデオを分析するために開発した、実績のある拡張性の高いディープラーニング テクノロジーに基づいています。使用するのに機械学習 (ML) の専門知識は必要ありません。当社はこのサービスに新しいコンピューター ビジョン機能を継続的に追加しています。 Amazon Rekognition には、保存されている画像またはビデオ ファイルを迅速に分析できる、シンプルで使いやすい API が含まれています。 Amazon シンプル ストレージ サービス (Amazon S3)。

広告およびマーケティング テクノロジー、ゲーム、メディア、小売および電子商取引などの業界の顧客は、プラットフォームでのエンゲージメントを促進するための重要なコンポーネントとして、エンドユーザーによってアップロードされた画像 (ユーザー生成コンテンツまたは UGC) に依存しています。彼らは使用します Amazon Rekognition コンテンツのモデレーション ブランドの評判を守り、安全なユーザー コミュニティを育成するために、不適切、望ましくない、不快なコンテンツを検出します。

この投稿では、次のことについて説明します。

  • Content Moderation モデルのバージョン 7.0 と機能
  • Amazon Rekognition 一括分析はコンテンツモデレーションのためにどのように機能しますか
  • 一括分析とカスタム モデレーションを使用してコンテンツ モデレーションの予測を改善する方法

コンテンツ管理モデルのバージョン 7.0 と機能

Amazon Rekognition Content Moderation バージョン 7.0 では、26 の新しいモデレーションラベルが追加され、モデレーションラベルの分類が XNUMX 層から XNUMX 層のラベルカテゴリに拡張されています。これらの新しいラベルと拡張された分類により、顧客はモデレートしたいコンテンツの詳細なコンセプトを検出できるようになります。さらに、更新されたモデルでは、アニメーション コンテンツとイラスト コンテンツという XNUMX つの新しいコンテンツ タイプを識別する新しい機能が導入されています。これにより、顧客はそのようなコンテンツ タイプをモデレーション ワークフローに含めたり除外したりするための詳細なルールを作成できます。これらの新しいアップデートにより、顧客はコンテンツ ポリシーに従ってより正確にコンテンツをモデレートできるようになります。

次の画像のモデレーション ラベル検出の例を見てみましょう。

次の表は、API 応答で返されるモデレーション ラベル、コンテンツ タイプ、および信頼スコアを示しています。

モデレーションラベル 分類レベル 信頼スコア
暴力 L1 視聴者の38%が
暴力場面 L2 視聴者の38%が
爆発と爆風 L3 視聴者の38%が
コンテンツタイプ 信頼スコア
図解 視聴者の38%が

Content Moderation バージョン 7.0 の完全な分類を取得するには、次のサイトにアクセスしてください。 開発者ガイド.

コンテンツモデレーションのための一括分析

Amazon Rekognition Content Moderation は、リアルタイム モデレーションに加えてバッチ画像モデレーションも提供します。 Amazon Rekognition の一括分析。これにより、大規模な画像コレクションを非同期的に分析して、不適切なコンテンツを検出し、画像に割り当てられたモデレーション カテゴリについての洞察を得ることができます。また、顧客向けにバッチ画像モデレーション ソリューションを構築する必要もなくなります。

一括分析機能には、Amazon Rekognition コンソール経由でアクセスするか、AWS CLI と AWS SDK を使用して API を直接呼び出すことでアクセスできます。 Amazon Rekognition コンソールでは、分析したい画像をアップロードし、数回クリックするだけで結果を得ることができます。一括分析ジョブが完了すると、親密な部分の明示的、非明示的ヌード、キス、暴力、薬物とタバコなどのモデレーション ラベル予測を特定して表示できます。各ラベル カテゴリの信頼スコアも受け取ります。

Amazon Rekognition コンソールで一括分析ジョブを作成する

Amazon Rekognition 一括分析を試すには、次の手順を実行します。

  1. Amazon Rekognitionコンソールで、次を選択します 一括分析 ナビゲーションペインに表示されます。
  2. 選択する 一括分析の開始.
  3. ジョブ名を入力し、S3 バケットの場所を入力するか、コンピューターから画像をアップロードすることで、分析する画像を指定します。
  4. オプションで、 アダプタ カスタム モデレーションを使用してトレーニングしたカスタム アダプターを使用して画像を分析します。
  5. 選択する 分析を開始 ジョブを実行します。

プロセスが完了すると、Amazon Rekognition コンソールで結果を確認できます。また、分析結果の JSON コピーは Amazon S3 の出力場所に保存されます。

Amazon Rekognition 一括分析 API リクエスト

このセクションでは、プログラミング インターフェイスを使用して画像モデレーションのための一括分析ジョブを作成する方法を説明します。画像ファイルがまだ S3 バケットにない場合は、Amazon Rekognition によるアクセスを確保するためにアップロードしてください。 Amazon Rekognition コンソールで一括分析ジョブを作成するのと同様に、 メディア分析ジョブの開始 API では、次のパラメータを指定する必要があります。

  • オペレーション設定 – 作成するメディア分析ジョブの構成オプションは次のとおりです。
    • 最小信頼度 – 返されるモデレーション ラベルの最小信頼レベル。有効範囲は 0 ~ 100 です。 Amazon Rekognition は、この指定された値よりも低い信頼レベルを持つラベルを返しません。
  • 入力 –これには以下が含まれます。
    • S3オブジェクト – バケットやファイル名など、入力マニフェスト ファイルの S3 オブジェクト情報。入力ファイルには、S3 バケットに保存されている各画像の JSON 行が含まれています。例えば: {"source-ref": "s3://MY-INPUT-BUCKET/1.jpg"}
  • 出力構成 –これには以下が含まれます。
    • S3バケット – 出力ファイルの S3 バケット名。
    • S3キープレフィックス – 出力ファイルのキープレフィックス。

次のコードを参照してください。

import boto3
import os
import datetime
import time
import json
import uuid

region = boto3.session.Session().region_name
s3=boto3.client('s3')
rekognition_client=boto3.client('rekognition', region_name=region)

min_confidence = 50
input_bucket = "MY-INPUT-BUCKET"

input_file = "input_file.jsonl"
output_bucket = "MY-OUTPUT-BUCKET"
key_prefix = "moderation-results"
job_name = "bulk-analysis-demo"

job_start_response = rekognition_client.start_media_analysis_job(
    OperationsConfig={"DetectModerationLabels": {"MinConfidence": min_confidence}},
    JobName = job_name,
    Input={"S3Object": {"Bucket": input_bucket, "Name": input_file}},
    OutputConfig={"S3Bucket": output_bucket, "S3KeyPrefix": key_prefix},
)

job_id = job_start_response["JobId"]
max_tries = 60
while max_tries > 0:
    max_tries -= 1
    job = rekognition_client.get_media_analysis_job(JobId=job_id)
    job_status = job["Status"]
    if job_status in ["SUCCEEDED", "FAILED"]:
        print(f"Job {job_name} is {job_status}.")
        if job_status == "SUCCEEDED":
            print(
                f"Bulk Analysis output file copied to:n"
                f"tBucket: {job['Results']['S3Object']['Bucket']}n"
                f"tObject: {job['Results']['S3Object']['Name']}."
            )
        break
    else:
        print(f"Waiting for {job_name}. Current status is {job_status}.")
    time.sleep(10)

次の AWS CLI コマンドを使用して、同じメディア分析を呼び出すことができます。

aws rekognition start-media-analysis-job 
--operations-config "DetectModerationLabels={MinConfidence='50'}" 
--input "S3Object={Bucket=input_bucket,Name=input_file.jsonl}" 
--output-config "S3Bucket=output_bucket,S3KeyPrefix=moderation-results"

Amazon Rekognition 一括分析 API の結果

一括分析ジョブのリストを取得するには、次を使用できます。 ListMediaAnalysisJobs。応答には、分析ジョブの入力ファイルと出力ファイル、およびジョブのステータスに関するすべての詳細が含まれます。

# get the latest 10 media analysis jobs
moderation_job_list = rekognition_client.list_media_analysis_jobs(MaxResults=10, NextToken="")
for job_result in moderation_job_list["MediaAnalysisJobs"]:
 print(f'JobId: {job_result["JobId"]} ,Status: {job_result["Status"]},n
Summary: {job_result["ManifestSummary"]["S3Object"]["Name"]}, n
Result: {job_result["Results"]["S3Object"]["Name"]}n')

を呼び出すこともできます。 list-media-analysis-jobs AWS CLI 経由のコマンド:

aws rekognition list-media-analysis-jobs --max-results 10

Amazon Rekognition Bulk Analysis は、出力バケットに 2 つの出力ファイルを生成します。最初のファイルは manifest-summary.jsonこれには、一括分析ジョブ統計とエラーのリストが含まれます。

{
    "version": "1.0",
    "statistics": {
      "total-json-lines": 2,
      "valid-json-lines": 2,
      "invalid-json-lines": 0
    },
    "errors": []
 }

2番目のファイルは results.jsonこれには、分析された画像ごとに次の形式で 1 ​​つの JSON 行が含まれます。各結果には次のものが含まれます。 最上位のカテゴリ 検出されたラベルの (L1) とラベルの第 2 レベルのカテゴリ (L1)。信頼スコアは 100 ~ 2 です。一部の分類レベル 3 ラベルには分類レベル 3 ラベル (LXNUMX) が含まれる場合があります。これにより、コンテンツを階層的に分類できます。

{
  "source-ref": "s3://MY-INPUT-BUCKET/1.jpg",
    "detect-moderation-labels": {
    "ModerationLabels": [
      {
        "ParentName": "Products",
        "TaxonomyLevel": 3,
        "Confidence": 91.9385,
        "Name": "Pills"
      },
      {
        "ParentName": "Drugs & Tobacco",
        "TaxonomyLevel": 2,
        "Confidence": 91.9385,
        "Name": "Products"
      },
      {
        "ParentName": "",
        "TaxonomyLevel": 1,
        "Confidence": 91.9385,
        "Name": "Drugs & Tobacco"
      }
    ],
    "ModerationModelVersion": "7.0",
    "ContentTypes": [
      
    ]
  }
}

一括分析とカスタム モデレーションを使用したコンテンツ モデレーション モデルの予測の改善

Content Moderation 基本モデルの精度を向上するには、 カスタムモデレーション 特徴。カスタムモデレーションを使用すると、 カスタムモデレーションアダプター 画像をアップロードし、これらの画像に注釈を付けることによって。アダプターは、Amazon Rekognition 深層学習モデルの機能を拡張および強化できるモジュール式コンポーネントです。画像に簡単に注釈を付けるには、一括分析ジョブの予測を検証してカスタム アダプターをトレーニングするだけです。予測結果を確認するには、次の手順に従います。

  1. Amazon Rekognitionコンソールで、次を選択します 一括分析 ナビゲーションペインに表示されます。
  2. 一括分析ジョブを選択し、 予測を検証する.

ソフトウェア設定ページで、下図のように 予測を検証する ページでは、このジョブで評価されたすべての画像と予測されたラベルを確認できます。

  1. True Positive を検証するには、各画像のラベルを存在するものとして選択 (チェック マーク) します。または、割り当てられた各ラベルを無効にするために、存在しないものとしてマーク (X マーク) します (つまり、ラベル予測は偽陽性です)。
  2. 適切なラベルが画像に割り当てられていない場合 (つまり、偽陰性)、正しいラベルを選択して画像に割り当てることもできます。

検証に基づいて、誤検知と誤検知が検証統計で更新されます。これらの検証を使用してカスタム モデレーション アダプターをトレーニングすることができ、これによりコンテンツ モデレーションの予測の精度を高めることができます。

  1. 前提条件として、カスタム モデレーション アダプターをトレーニングするには、改善するモデレーション ラベルごとに少なくとも 20 個の誤検知または 50 個の誤検知を検証する必要があります。 20 件の偽陽性または 50 件の偽陰性を確認したら、次のいずれかを選択できます。 アダプターをトレーニングする.

あなたが使用することができます カスタムモデレーションアダプター 後で画像を分析するには、新しい一括分析ジョブの作成時にカスタム アダプターを選択するか、API 経由でカスタム アダプターの一意のアダプター ID を渡します。

まとめ

この投稿では、コンテンツ モデレーション バージョン 7.0、コンテンツ モデレーションの一括分析の概要、および一括分析とカスタム モデレーションを使用してコンテンツ モデレーションの予測を改善する方法について説明しました。新しいモデレーションラベルと一括分析を試すには、AWS アカウントにログインし、Amazon Rekognition コンソールで次のことを確認してください。 画像の管理 & 一括分析.


著者について

メディ・ハギー AWS WWCS チームのシニア ソリューション アーキテクトで、AWS 上の AI と ML を専門としています。彼は企業顧客と協力して、AWS クラウドへのワークロードの移行、最新化、最適化を支援しています。余暇には、ペルシャ料理の料理や電子機器いじりを楽しんでいます。

シプラ・カノリア AWS のプリンシパル プロダクト マネージャーです。 彼女は、機械学習と人工知能の力を利用して、顧客が最も複雑な問題を解決できるよう支援することに情熱を注いでいます。 AWS に入社する前、Shipra は Amazon Alexa で 4 年以上過ごし、Alexa 音声アシスタントで多くの生産性関連機能を立ち上げました。

マリア・ハンドコ AWS のシニア プロダクト マネージャーです。 彼女は、機械学習とコンピューター ビジョンを通じて顧客がビジネス上の課題を解決できるよう支援することに重点を置いています。 余暇には、ハイキング、ポッドキャストの視聴、さまざまな料理の探索を楽しんでいます。

スポット画像

最新のインテリジェンス

スポット画像