제퍼넷 로고

Amazon Rekognition 대량 분석 및 사용자 지정 조정을 통해 콘텐츠 조정 개선 | 아마존 웹 서비스

시간

아마존 인식 애플리케이션에 이미지 및 비디오 분석을 쉽게 추가할 수 있습니다. 이는 Amazon의 컴퓨터 비전 과학자들이 매일 수십억 개의 이미지와 비디오를 분석하기 위해 개발한 것과 동일한 검증되고 확장성이 뛰어난 딥 러닝 기술을 기반으로 합니다. 사용하는 데 기계 학습(ML) 전문 지식이 필요하지 않으며 서비스에 새로운 컴퓨터 비전 기능을 지속적으로 추가하고 있습니다. Amazon Rekognition에는 Amazon Rekognition에 저장된 모든 이미지 또는 비디오 파일을 빠르게 분석할 수 있는 간단하고 사용하기 쉬운 API가 포함되어 있습니다. 아마존 단순 스토리지 서비스 (아마존 S3).

광고 및 마케팅 기술, 게임, 미디어, 소매 및 전자 상거래 등 산업 전반의 고객은 최종 사용자가 업로드한 이미지(사용자 생성 콘텐츠 또는 UGC)를 플랫폼 참여를 유도하는 중요한 구성 요소로 의존합니다. 그들은 사용한다 Amazon Rekognition 콘텐츠 조정 브랜드 평판을 보호하고 안전한 사용자 커뮤니티를 조성하기 위해 부적절하고 원치 않으며 공격적인 콘텐츠를 탐지합니다.

이 게시물에서는 다음에 대해 논의합니다.

  • 콘텐츠 조정 모델 버전 7.0 및 기능
  • Amazon Rekognition 대량 분석은 콘텐츠 조정에 어떻게 작동하나요?
  • 대량 분석 및 사용자 정의 조정을 통해 콘텐츠 조정 예측을 개선하는 방법

콘텐츠 조정 모델 버전 7.0 및 기능

Amazon Rekognition Content Moderation 버전 7.0은 26개의 새로운 조정 레이블을 추가하고 조정 레이블 분류를 XNUMX계층에서 XNUMX계층 레이블 범주로 확장합니다. 이러한 새로운 레이블과 확장된 분류를 통해 고객은 조정하려는 콘텐츠에 대한 세부적인 개념을 감지할 수 있습니다. 또한 업데이트된 모델에는 애니메이션 및 그림 콘텐츠라는 두 가지 새로운 콘텐츠 유형을 식별하는 새로운 기능이 도입되었습니다. 이를 통해 고객은 중재 워크플로에서 해당 콘텐츠 유형을 포함하거나 제외하기 위한 세부적인 규칙을 만들 수 있습니다. 이러한 새로운 업데이트를 통해 고객은 콘텐츠 정책에 따라 콘텐츠를 더 정확하게 조정할 수 있습니다.

다음 이미지에 대한 조정 라벨 감지 예시를 살펴보겠습니다.

다음 표에는 API 응답에 반환된 중재 레이블, 콘텐츠 유형 및 신뢰도 점수가 나와 있습니다.

중재 라벨 분류 수준 신뢰 점수
폭력 L1 92.6%
그래픽 폭력 L2 92.6%
폭발 및 폭발 L3 92.6%
콘텐츠 유형 신뢰 점수
삽화가 든 93.9%

Content Moderation 버전 7.0의 전체 분류를 확인하려면 다음을 방문하세요. 개발자 가이드.

콘텐츠 조정을 위한 대량 분석

Amazon Rekognition Content Moderation은 다음을 사용하여 실시간 조정 외에도 배치 이미지 조정도 제공합니다. Amazon Rekognition 대량 분석. 이를 통해 대규모 이미지 컬렉션을 비동기식으로 분석하여 부적절한 콘텐츠를 감지하고 이미지에 할당된 조정 범주에 대한 통찰력을 얻을 수 있습니다. 또한 고객을 위해 일괄 이미지 조정 솔루션을 구축할 필요가 없습니다.

Amazon Rekognition 콘솔을 통해 또는 AWS CLI 및 AWS SDK를 사용하여 API를 직접 호출하여 대량 분석 기능에 액세스할 수 있습니다. Amazon Rekognition 콘솔에서는 몇 번의 클릭만으로 분석하려는 이미지를 업로드하고 결과를 얻을 수 있습니다. 대량 분석 작업이 완료되면 은밀한 부분의 노골적, 비노골적 누드, 키스, 폭력, 마약 및 담배 등과 같은 조정 레이블 예측을 식별하고 볼 수 있습니다. 또한 각 라벨 카테고리에 대한 신뢰도 점수를 받습니다.

Amazon Rekognition 콘솔에서 대량 분석 작업 생성

Amazon Rekognition 대량 분석을 시도하려면 다음 단계를 완료하십시오.

  1. Amazon Rekognition 콘솔에서 벌크 분석 탐색 창에서
  2. 왼쪽 메뉴에서 대량 분석 시작.
  3. 작업 이름을 입력하고 S3 버킷 위치를 입력하거나 컴퓨터에서 이미지를 업로드하여 분석할 이미지를 지정합니다.
  4. 선택적으로 다음을 선택할 수 있습니다. 어댑터 Custom Moderation을 사용하여 훈련한 사용자 정의 어댑터를 사용하여 이미지를 분석합니다.
  5. 왼쪽 메뉴에서 분석 시작 작업을 실행합니다.

프로세스가 완료되면 Amazon Rekognition 콘솔에서 결과를 볼 수 있습니다. 또한 분석 결과의 JSON 사본이 Amazon S3 출력 위치에 저장됩니다.

Amazon Rekognition 대량 분석 API 요청

이 섹션에서는 프로그래밍 인터페이스를 사용하여 이미지 조정을 위한 대량 분석 작업을 생성하는 방법을 안내합니다. 이미지 파일이 아직 S3 버킷에 없으면 업로드하여 Amazon Rekognition에서 액세스할 수 있도록 하세요. Amazon Rekognition 콘솔에서 대량 분석 작업을 생성하는 것과 유사합니다. StartMedia분석작업 API를 사용하려면 다음 매개변수를 제공해야 합니다.

  • 작업 구성 – 생성할 미디어 분석 작업에 대한 구성 옵션은 다음과 같습니다.
    • 최소 신뢰도 – 반환할 조정 레이블에 대한 유효 범위가 0~100인 최소 신뢰 수준입니다. Amazon Rekognition은 지정된 값보다 신뢰 수준이 낮은 레이블을 반환하지 않습니다.
  • 입력 – 여기에는 다음이 포함됩니다.
    • S3객체 – 버킷 및 파일 이름을 포함하여 입력 매니페스트 파일에 대한 S3 객체 정보입니다. 입력 파일에는 S3 버킷에 저장된 각 이미지에 대한 JSON 라인이 포함되어 있습니다. 예를 들어: {"source-ref": "s3://MY-INPUT-BUCKET/1.jpg"}
  • 출력 구성 – 여기에는 다음이 포함됩니다.
    • S3버킷 – 출력 파일의 S3 버킷 이름입니다.
    • S3KeyPrefix – 출력 파일의 키 접두사입니다.

다음 코드를 참조하십시오.

import boto3
import os
import datetime
import time
import json
import uuid

region = boto3.session.Session().region_name
s3=boto3.client('s3')
rekognition_client=boto3.client('rekognition', region_name=region)

min_confidence = 50
input_bucket = "MY-INPUT-BUCKET"

input_file = "input_file.jsonl"
output_bucket = "MY-OUTPUT-BUCKET"
key_prefix = "moderation-results"
job_name = "bulk-analysis-demo"

job_start_response = rekognition_client.start_media_analysis_job(
    OperationsConfig={"DetectModerationLabels": {"MinConfidence": min_confidence}},
    JobName = job_name,
    Input={"S3Object": {"Bucket": input_bucket, "Name": input_file}},
    OutputConfig={"S3Bucket": output_bucket, "S3KeyPrefix": key_prefix},
)

job_id = job_start_response["JobId"]
max_tries = 60
while max_tries > 0:
    max_tries -= 1
    job = rekognition_client.get_media_analysis_job(JobId=job_id)
    job_status = job["Status"]
    if job_status in ["SUCCEEDED", "FAILED"]:
        print(f"Job {job_name} is {job_status}.")
        if job_status == "SUCCEEDED":
            print(
                f"Bulk Analysis output file copied to:n"
                f"tBucket: {job['Results']['S3Object']['Bucket']}n"
                f"tObject: {job['Results']['S3Object']['Name']}."
            )
        break
    else:
        print(f"Waiting for {job_name}. Current status is {job_status}.")
    time.sleep(10)

다음 AWS CLI 명령을 사용하여 동일한 미디어 분석을 호출할 수 있습니다.

aws rekognition start-media-analysis-job 
--operations-config "DetectModerationLabels={MinConfidence='50'}" 
--input "S3Object={Bucket=input_bucket,Name=input_file.jsonl}" 
--output-config "S3Bucket=output_bucket,S3KeyPrefix=moderation-results"

Amazon Rekognition 대량 분석 API 결과

대량 분석 작업 목록을 얻으려면 다음을 사용할 수 있습니다. ListMediaAnalysisJobs. 응답에는 분석 작업 입력 및 출력 파일과 작업 상태에 대한 모든 세부 정보가 포함됩니다.

# get the latest 10 media analysis jobs
moderation_job_list = rekognition_client.list_media_analysis_jobs(MaxResults=10, NextToken="")
for job_result in moderation_job_list["MediaAnalysisJobs"]:
 print(f'JobId: {job_result["JobId"]} ,Status: {job_result["Status"]},n
Summary: {job_result["ManifestSummary"]["S3Object"]["Name"]}, n
Result: {job_result["Results"]["S3Object"]["Name"]}n')

또한 list-media-analysis-jobs AWS CLI를 통한 명령:

aws rekognition list-media-analysis-jobs --max-results 10

Amazon Rekognition Bulk Analysis는 출력 버킷에 두 개의 출력 파일을 생성합니다. 첫 번째 파일은 manifest-summary.json, 여기에는 대량 분석 작업 통계 및 오류 목록이 포함됩니다.

{
    "version": "1.0",
    "statistics": {
      "total-json-lines": 2,
      "valid-json-lines": 2,
      "invalid-json-lines": 0
    },
    "errors": []
 }

두 번째 파일은 results.json, 여기에는 다음 형식으로 분석된 각 이미지당 하나의 JSON 라인이 포함됩니다. 각 결과에는 다음이 포함됩니다. 최상위 카테고리 감지된 라벨의 (L1) 및 라벨의 두 번째 수준 카테고리(L2), 신뢰도 점수는 1~100입니다. 일부 분류 수준 2 레이블에는 분류 수준 3 레이블(L3)이 있을 수 있습니다. 이를 통해 콘텐츠를 계층적으로 분류할 수 있습니다.

{
  "source-ref": "s3://MY-INPUT-BUCKET/1.jpg",
    "detect-moderation-labels": {
    "ModerationLabels": [
      {
        "ParentName": "Products",
        "TaxonomyLevel": 3,
        "Confidence": 91.9385,
        "Name": "Pills"
      },
      {
        "ParentName": "Drugs & Tobacco",
        "TaxonomyLevel": 2,
        "Confidence": 91.9385,
        "Name": "Products"
      },
      {
        "ParentName": "",
        "TaxonomyLevel": 1,
        "Confidence": 91.9385,
        "Name": "Drugs & Tobacco"
      }
    ],
    "ModerationModelVersion": "7.0",
    "ContentTypes": [
      
    ]
  }
}

대량 분석 및 사용자 정의 조정을 사용하여 콘텐츠 조정 모델 예측 개선

다음을 사용하여 콘텐츠 조정 기본 모델의 정확성을 향상시킬 수 있습니다. 맞춤 조정 특징. Custom Moderation을 사용하면 사용자 정의 중재 어댑터 이미지를 업로드하고 이미지에 주석을 달아보세요. 어댑터는 Amazon Rekognition 딥 러닝 모델의 기능을 확장하고 향상할 수 있는 모듈식 구성 요소입니다. 이미지에 쉽게 주석을 달려면 대량 분석 작업의 예측을 확인하여 사용자 지정 어댑터를 훈련하면 됩니다. 예측 결과를 확인하려면 다음 단계를 따르세요.

  1. Amazon Rekognition 콘솔에서 벌크 분석 탐색 창에서
  2. 대량 분석 작업을 선택한 다음 예측 확인.

예측 확인 페이지에서는 이 작업에서 평가된 모든 이미지와 예측 라벨을 볼 수 있습니다.

  1. 참양성을 확인하려면 각 이미지의 레이블을 현재 상태(확인 표시)로 선택하세요. 또는 존재하지 않음(X 표시)으로 표시하여 할당된 각 라벨을 무효화합니다(예: 라벨 예측이 거짓 긍정임).
  2. 이미지에 적절한 라벨이 할당되지 않은 경우(예: False Negative) 이미지에 올바른 라벨을 선택하여 할당할 수도 있습니다.

귀하의 확인에 따라 확인 통계에서 거짓양성 및 거짓음성이 업데이트됩니다. 이러한 확인을 사용하여 사용자 정의 조정 어댑터를 교육할 수 있으며 이를 통해 콘텐츠 조정 예측의 정확성을 높일 수 있습니다.

  1. 전제 조건으로 사용자 정의 중재 어댑터를 교육하려면 개선하려는 각 중재 레이블에 대해 최소 20개의 거짓 긍정 또는 50개의 거짓 부정을 확인해야 합니다. 20개의 거짓 긍정 또는 50개의 거짓 부정을 확인하면 선택할 수 있습니다. 어댑터 훈련.

당신이 사용할 수 사용자 정의 조정 어댑터 나중에 새로운 대량 분석 작업을 생성하는 동안 사용자 지정 어댑터를 선택하거나 API를 통해 사용자 지정 어댑터의 고유 어댑터 ID를 전달하여 이미지를 분석할 수 있습니다.

요약

이 게시물에서는 콘텐츠 조정 버전 7.0, 콘텐츠 조정을 위한 대량 분석, 대량 분석 및 사용자 정의 조정을 사용하여 콘텐츠 조정 예측을 개선하는 방법에 대한 개요를 제공했습니다. 새로운 조정 레이블과 대량 분석을 사용해 보려면 AWS 계정에 로그인하고 Amazon Rekognition 콘솔에서 이미지 조정벌크 분석.


저자 소개

메흐디 하기이 AWS의 AI 및 ML을 전문으로 하는 AWS WWCS 팀의 수석 솔루션 아키텍트입니다. 그는 기업 고객과 협력하여 AWS 클라우드에 대한 워크로드를 마이그레이션, 현대화 및 최적화하도록 돕습니다. 여가 시간에는 페르시아 음식 요리와 전자 제품 손질을 즐깁니다.

시프라 카노리아 AWS의 수석 제품 관리자입니다. 그녀는 기계 학습 및 인공 지능의 힘으로 고객이 가장 복잡한 문제를 해결하도록 돕는 데 열정적입니다. AWS에 합류하기 전에 Shipra는 Amazon Alexa에서 4년 이상 근무하면서 Alexa 음성 비서에서 많은 생산성 관련 기능을 출시했습니다.

마리아 한도코 AWS의 선임 제품 관리자입니다. 그녀는 기계 학습 및 컴퓨터 비전을 통해 고객이 비즈니스 문제를 해결하도록 돕는 데 중점을 둡니다. 여가 시간에는 하이킹, 팟캐스트 청취, 다양한 요리 탐색을 즐깁니다.

spot_img

최신 인텔리전스

spot_img