Logo Zephyrnet

Kiểm duyệt luồng trực tiếp Amazon IVS của bạn bằng Amazon Rekognition | Dịch vụ web của Amazon

Ngày:

Dịch vụ video tương tác của Amazon (Amazon IVS) là một giải pháp phát trực tiếp có quản lý, được thiết kế nhằm cung cấp quy trình thiết lập nhanh chóng và đơn giản nhằm giúp bạn xây dựng trải nghiệm video tương tác và xử lý nội dung video tương tác từ khi nhập đến khi phân phối.

Với việc sử dụng tính năng phát trực tiếp ngày càng tăng, nhu cầu kiểm duyệt nội dung hiệu quả càng trở nên quan trọng hơn. Nội dung do người dùng tạo (UGC) đưa ra những thách thức phức tạp về an toàn. Nhiều công ty dựa vào người kiểm duyệt để giám sát luồng video. Việc này tốn thời gian, dễ xảy ra lỗi và không mở rộng theo tốc độ tăng trưởng kinh doanh. Một giải pháp kiểm duyệt tự động hỗ trợ con người trong vòng lặp (HITL) ngày càng cần thiết.

Kiểm duyệt nội dung Rekognition của Amazon, một khả năng của Nhận thức lại Amazon, tự động hóa và hợp lý hóa quy trình kiểm duyệt hình ảnh và video mà không yêu cầu trải nghiệm học máy (ML). Trong bài đăng này, chúng tôi giải thích cách thực hành phổ biến về kiểm duyệt hình ảnh phát trực tiếp bằng giải pháp sử dụng API hình ảnh Rekognition của Amazon để kiểm duyệt các luồng trực tiếp. Bạn có thể triển khai giải pháp này vào tài khoản AWS của mình bằng cách sử dụng Bộ công cụ phát triển đám mây AWS (AWS CDK) gói có sẵn trong Repo GitHub.

Kiểm duyệt nội dung hình ảnh phát trực tiếp

Cách tiếp cận phổ biến nhất để kiểm duyệt hình ảnh luồng trực tiếp UGC bao gồm lấy mẫu hình ảnh từ luồng và sử dụng kiểm duyệt hình ảnh để nhận được kết quả gần như thời gian thực. Nền tảng phát trực tiếp có thể sử dụng các quy tắc linh hoạt để kiểm duyệt nội dung trực quan. Ví dụ: các nền tảng có khán giả trẻ hơn có thể có các quy tắc nghiêm ngặt về nội dung người lớn và một số sản phẩm nhất định, trong khi những nền tảng khác có thể tập trung vào các biểu tượng căm thù. Các nền tảng này thiết lập các quy tắc khác nhau để phù hợp với chính sách của họ một cách hiệu quả. Kết hợp đánh giá của con người và tự động, quy trình kết hợp là một phương pháp thiết kế phổ biến. Một số luồng nhất định sẽ tự động bị dừng nhưng người kiểm duyệt cũng sẽ đánh giá xem liệu luồng có vi phạm chính sách nền tảng hay không và có nên ngừng hoạt động hay không.

Sơ đồ sau đây minh họa quy trình làm việc mang tính khái niệm của hệ thống kiểm duyệt gần thời gian thực, được thiết kế với khả năng kết nối lỏng lẻo với hệ thống phát trực tiếp.

Giới thiệu chung

Dòng công việc bao gồm các bước sau:

  1. Dịch vụ phát trực tiếp (hoặc ứng dụng khách) lấy mẫu khung hình ảnh từ luồng video dựa trên một khoảng thời gian cụ thể.
  2. Công cụ quy tắc đánh giá các nguyên tắc kiểm duyệt, xác định tần suất lấy mẫu luồng và các danh mục kiểm duyệt có thể áp dụng, tất cả đều nằm trong các chính sách được xác định trước. Quá trình này liên quan đến việc sử dụng cả thuật toán ML và không phải ML.
  3. Công cụ quy tắc cảnh báo người kiểm duyệt khi phát hiện vi phạm trong luồng video.
  4. Người điều hành con người đánh giá kết quả và hủy kích hoạt luồng trực tiếp.

Kiểm duyệt luồng trực tiếp UGC khác với kiểm duyệt video cổ điển trên phương tiện truyền thông. Nó phục vụ cho các quy định đa dạng. Tần suất lấy mẫu hình ảnh từ khung hình video để kiểm duyệt thường được xác định theo chính sách Tin cậy & An toàn của nền tảng và thỏa thuận cấp độ dịch vụ (SLA). Ví dụ: nếu một nền tảng phát trực tiếp có mục đích dừng các kênh trong vòng 3 phút do vi phạm chính sách, thì cách tiếp cận thực tế là lấy mẫu cứ sau 1–2 phút, để người kiểm duyệt có thời gian xác minh và thực hiện hành động. Một số nền tảng yêu cầu kiểm soát tần suất điều tiết linh hoạt. Ví dụ: những người phát trực tiếp có uy tín cao có thể cần ít sự kiểm duyệt hơn, trong khi những người phát trực tiếp mới cần được chú ý kỹ hơn. Điều này cũng cho phép tối ưu hóa chi phí bằng cách giảm tần suất lấy mẫu.

Chi phí là yếu tố quan trọng cần cân nhắc trong bất kỳ giải pháp kiểm duyệt sự kiện phát trực tiếp nào. Khi các nền tảng phát trực tiếp UGC nhanh chóng mở rộng, việc kiểm duyệt các luồng phát đồng thời ở tần suất cao có thể làm tăng mối lo ngại về chi phí. Giải pháp được trình bày trong bài đăng này được thiết kế để tối ưu hóa chi phí bằng cách cho phép bạn xác định quy tắc kiểm duyệt để tùy chỉnh tần suất mẫu, bỏ qua các khung hình tương tự và các kỹ thuật khác.

Ghi nội dung luồng Amazon IVS vào Amazon S3

Amazon IVS cung cấp các giải pháp gốc cho ghi nội dung luồng đến một Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) và tạo hình thu nhỏ—khung hình ảnh từ luồng video. Theo mặc định, nó tạo hình thu nhỏ cứ sau 60 giây và cung cấp cho người dùng tùy chọn tùy chỉnh chất lượng và tần suất hình ảnh. Sử dụng Bảng điều khiển quản lý AWS, Bạn có thể tạo cấu hình ghi âm và liên kết nó với kênh Amazon IVS. Khi cấu hình ghi được liên kết với một kênh, các luồng trực tiếp của kênh đó sẽ tự động được ghi vào bộ chứa S3 được chỉ định.

Amazon IVS không tính phí khi sử dụng tính năng tự động ghi vào Amazon S3 hoặc ghi vào Amazon S3. Có phí lưu trữ trên Amazon S3, các lệnh gọi API của Amazon S3 mà Amazon IVS thực hiện thay mặt cho khách hàng và phân phối video được lưu trữ tới người xem. Để biết chi tiết về chi phí của Amazon IVS, hãy tham khảo Chi phí (Truyền phát có độ trễ thấp).

API kiểm duyệt Amazon Rekognition

Trong giải pháp này, chúng tôi sử dụng API Amazon Rekognition DetectModerationLabel để kiểm duyệt hình thu nhỏ của Amazon IVS trong thời gian gần như thực. Amazon Rekognition Content Moderation cung cấp các API được đào tạo trước để phân tích nhiều nội dung không phù hợp hoặc gây khó chịu, chẳng hạn như bạo lực, ảnh khỏa thân, biểu tượng căm thù, v.v. Để biết danh sách đầy đủ về các nguyên tắc phân loại Kiểm duyệt nội dung của Amazon Rekognition, hãy tham khảo Kiểm duyệt nội dung.

Đoạn mã sau đây minh họa cách gọi API Amazon Rekognition DetectModerationLabel để kiểm duyệt hình ảnh trong một AWS Lambda chức năng sử dụng thư viện Python Boto3:

import boto3 # Initialize the Amazon Rekognition client object
rekognition = boto3.client('rekognition') # Call the Rekognition Image moderation API
response = rekognition.detect_moderation_labels( Image={'S3Object': {'Bucket': data_bucket,'Name': s3_key}}
)

Sau đây là phản hồi mẫu từ API kiểm duyệt hình ảnh Amazon Rekognition:

{ "ModerationLabels": [ { "Confidence": 99.9290542602539, "Name": "Female Swimwear Or Underwear", "ParentName": "Suggestive" }, ... ], "ModerationModelVersion": "6.1"
}

Để biết thêm ví dụ về API kiểm duyệt hình ảnh Amazon Rekognition, hãy tham khảo Phòng thí nghiệm hình ảnh kiểm duyệt nội dung.

Tổng quan về giải pháp

Giải pháp này tích hợp với Amazon IVS bằng cách đọc hình ảnh thu nhỏ từ bộ chứa S3 và gửi hình ảnh tới API kiểm duyệt hình ảnh Amazon Rekognition. Nó cung cấp các lựa chọn để tự động dừng luồng và đánh giá con người trong vòng lặp. Bạn có thể định cấu hình quy tắc để hệ thống tự động tạm dừng luồng dựa trên các điều kiện. Nó cũng bao gồm một cổng đánh giá nhẹ nhàng của con người, trao quyền cho người kiểm duyệt giám sát các luồng, quản lý cảnh báo vi phạm và dừng các luồng khi cần thiết.

Trong phần này chúng tôi giới thiệu ngắn gọn về kiến ​​trúc hệ thống. Để biết thêm thông tin chi tiết, hãy tham khảo Repo GitHub.

Bản ghi màn hình sau đây hiển thị giao diện người dùng của người kiểm duyệt, cho phép họ giám sát các luồng đang hoạt động kèm theo cảnh báo kiểm duyệt và thực hiện các hành động như dừng luồng hoặc loại bỏ cảnh báo.

Người điều hành bản demo

Người dùng có thể tùy chỉnh quy tắc kiểm duyệt, kiểm soát tần suất mẫu luồng video trên mỗi kênh, đặt cấu hình danh mục kiểm duyệt Amazon Rekognition với ngưỡng tin cậy và bật kiểm tra độ tương tự, đảm bảo hiệu suất và tối ưu hóa chi phí bằng cách tránh xử lý hình ảnh dư thừa.

Bản ghi màn hình sau đây hiển thị giao diện người dùng để quản lý cấu hình chung.

Cấu hình demo

Giải pháp này sử dụng kiến ​​trúc vi dịch vụ, bao gồm hai thành phần chính được liên kết lỏng lẻo với Amazon IVS.

Kiến trúc tổng thể

công cụ quy tắc

Công cụ quy tắc tạo thành xương sống của hệ thống kiểm duyệt luồng trực tiếp. Đây là một dịch vụ xử lý trực tiếp cho phép kiểm duyệt gần như theo thời gian thực. Nó sử dụng Amazon Rekognition để kiểm duyệt hình ảnh, xác thực kết quả theo các quy tắc có thể tùy chỉnh, sử dụng thuật toán băm hình ảnh để nhận dạng và loại trừ các hình ảnh tương tự, đồng thời có thể tự động dừng phát trực tuyến hoặc cảnh báo hệ thống con đánh giá của con người khi vi phạm quy tắc. Dịch vụ này tích hợp với Amazon IVS thông qua chức năng đọc hình ảnh dựa trên Amazon S3 và hỗ trợ việc gọi API thông qua Cổng API Amazon.

Sơ đồ kiến ​​trúc sau đây minh họa quy trình kiểm duyệt gần như thời gian thực.

Công cụ quy tắc

Có hai phương pháp để kích hoạt quy trình xử lý công cụ quy tắc:

  • Trình kích hoạt tệp S3 – Khi một hình ảnh mới được thêm vào nhóm S3, quy trình làm việc sẽ bắt đầu. Đây là cách được khuyến nghị để tích hợp Amazon IVS.
  • Cuộc gọi API REST – Bạn có thể thực hiện lệnh gọi API RESTful tới Cổng API bằng các byte hình ảnh trong nội dung yêu cầu. API lưu trữ hình ảnh trong bộ chứa S3, kích hoạt quá trình xử lý gần như thời gian thực. Cách tiếp cận này phù hợp với hình ảnh được phía máy khách của ứng dụng phát trực tiếp chụp và truyền qua internet.

Quy trình xử lý hình ảnh được quản lý bởi Chức năng bước AWS, bao gồm một số bước:

  1. Kiểm tra quy tắc tần số mẫu. Quá trình xử lý sẽ dừng lại nếu thời gian lấy mẫu trước đó quá gần.
  2. Nếu được bật trong cấu hình, hãy thực hiện kiểm tra độ tương tự bằng thuật toán băm hình ảnh. Quá trình sẽ bỏ qua hình ảnh nếu nó giống với hình ảnh trước đó nhận được cho cùng một kênh.
  3. Sử dụng API kiểm duyệt hình ảnh Amazon Rekognition để đánh giá hình ảnh theo các quy tắc đã định cấu hình, áp dụng ngưỡng tin cậy và bỏ qua các danh mục không cần thiết.
  4. Nếu kết quả kiểm duyệt vi phạm bất kỳ quy tắc nào, hãy gửi thông báo tới Dịch vụ thông báo đơn giản của Amazon (Amazon SNS), cảnh báo các hệ thống hạ nguồn bằng các cảnh báo kiểm duyệt.
  5. Nếu vi phạm quy tắc kiểm duyệt tự động dừng, luồng Amazon IVS sẽ tự động bị dừng.

Thiết kế quản lý các quy tắc thông qua máy trạng thái Step Functions, cung cấp GUI kéo và thả để xác định quy trình làm việc linh hoạt. Bạn có thể mở rộng công cụ quy tắc bằng cách kết hợp các quy trình công việc Step Functions bổ sung.

Bảng điều khiển giám sát và quản lý

Bảng thông tin giám sát và quản lý là một ứng dụng web có giao diện người dùng cho phép người kiểm duyệt giám sát các luồng trực tiếp của Amazon IVS. Nó cung cấp các cảnh báo kiểm duyệt gần như theo thời gian thực, cho phép người kiểm duyệt dừng luồng hoặc loại bỏ cảnh báo. Cổng web cũng trao quyền cho quản trị viên quản lý các quy tắc kiểm duyệt cho công cụ quy tắc. Nó hỗ trợ hai loại cấu hình:

  • Quy tắc kênh – Bạn có thể xác định quy tắc cho các kênh cụ thể.
  • Quy tắc toàn cầu – Các quy tắc này áp dụng cho tất cả hoặc một tập hợp con các kênh Amazon IVS thiếu cấu hình cụ thể. Bạn có thể xác định biểu thức chính quy để áp dụng quy tắc chung cho tên kênh Amazon IVS khớp với mẫu. Ví dụ: .* áp dụng cho tất cả các kênh. /^test-/ áp dụng cho các kênh có tên bắt đầu bằng test-.

Hệ thống này là một ứng dụng web không có máy chủ, có giao diện người dùng React tĩnh được lưu trữ trên Amazon S3 với Amazon CloudFront cho bộ nhớ đệm. Việc xác thực được xử lý bởi Nhận thức về Amazon. Dữ liệu được cung cấp thông qua API Gateway và Lambda, với bộ lưu trữ trạng thái ở Máy phát điện Amazon. Sơ đồ sau minh họa kiến ​​trúc này.

Ứng dụng web

Bảng thông tin giám sát là một ứng dụng demo nhẹ cung cấp các tính năng cần thiết cho người kiểm duyệt. Để nâng cao chức năng, bạn có thể mở rộng quá trình triển khai để hỗ trợ nhiều người kiểm duyệt bằng một hệ thống quản lý và giảm độ trễ bằng cách triển khai cơ chế đẩy bằng WebSockets.

Độ trễ kiểm duyệt

Giải pháp này được thiết kế để kiểm duyệt gần như thời gian thực, với độ trễ được đo trên hai hệ thống con riêng biệt:

  • Quy trình làm việc của công cụ quy tắc – Quy trình làm việc của công cụ quy tắc, từ nhận hình ảnh đến gửi thông báo qua Amazon SNS, trung bình trong vòng 2 giây. Dịch vụ này xử lý kịp thời các hình ảnh thông qua máy trạng thái Step Functions. API kiểm duyệt hình ảnh Amazon Rekognition xử lý dưới 500 mili giây đối với kích thước tệp trung bình dưới 1 MB. (Những phát hiện này dựa trên các thử nghiệm được tiến hành với ứng dụng mẫu, đáp ứng các yêu cầu gần như thời gian thực.) Trong Amazon IVS, bạn có tùy chọn để chọn các tùy chọn khác nhau. độ phân giải hình thu nhỏ để điều chỉnh kích thước hình ảnh.
  • Cổng thông tin giám sát – Cổng web giám sát đăng ký chủ đề SNS của công cụ quy tắc. Nó ghi lại các cảnh báo trong bảng DynamoDB, trong khi giao diện người dùng trang web tìm nạp các cảnh báo mới nhất cứ sau 10 giây. Thiết kế này thể hiện một cách nhẹ nhàng quan điểm của người điều hành. Để giảm độ trễ hơn nữa, hãy cân nhắc triển khai WebSocket để ngay lập tức gửi cảnh báo đến giao diện người dùng khi cảnh báo đến qua Amazon SNS.

Mở rộng giải pháp

Bài đăng này tập trung vào việc kiểm duyệt nội dung trực quan khi phát trực tiếp. Tuy nhiên, giải pháp này rất linh hoạt, có khả năng đáp ứng các quy tắc kinh doanh phức tạp và có thể mở rộng để hỗ trợ các loại phương tiện khác, bao gồm kiểm duyệt tin nhắn trò chuyện và âm thanh trong luồng trực tiếp. Bạn có thể nâng cao công cụ quy tắc bằng cách giới thiệu quy trình làm việc của máy trạng thái Step Functions mới với logic điều phối ngược dòng. Chúng ta sẽ tìm hiểu sâu hơn về kiểm duyệt văn bản và âm thanh phát trực tiếp bằng dịch vụ AWS AI trong các bài đăng sắp tới.

Tổng kết

Trong bài đăng này, chúng tôi đã cung cấp thông tin tổng quan về giải pháp mẫu giới thiệu cách kiểm duyệt video phát trực tiếp Amazon IVS bằng Amazon Rekognition. Bạn có thể trải nghiệm ứng dụng mẫu bằng cách làm theo hướng dẫn trong Repo GitHub và triển khai nó vào tài khoản AWS của bạn bằng gói AWS CDK đi kèm.

Tìm hiểu thêm về kiểm duyệt nội dung trên AWS. Hãy bước bước đầu tiên về phía hợp lý hóa các hoạt động kiểm duyệt nội dung của bạn với AWS.


Về các tác giả

Tác giả Lana ZhangTrương Lana là Kiến trúc sư giải pháp cấp cao tại nhóm Dịch vụ AI của AWS WWSO, chuyên về AI và ML để kiểm duyệt nội dung, Thị giác máy tính, Xử lý ngôn ngữ tự nhiên và AI sáng tạo. Với chuyên môn của mình, cô tận tâm quảng bá các giải pháp AI/ML của AWS và hỗ trợ khách hàng chuyển đổi các giải pháp kinh doanh của họ trong nhiều ngành khác nhau, bao gồm truyền thông xã hội, trò chơi, thương mại điện tử, truyền thông, quảng cáo & tiếp thị.

Tác giả Tony VũTony Vũ là Kỹ sư đối tác cấp cao tại Twitch. Ông chuyên đánh giá công nghệ của đối tác để tích hợp với Amazon Interactive Video Service (IVS), nhằm phát triển và cung cấp các giải pháp chung toàn diện cho khách hàng IVS của chúng tôi.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img