Cách Synamedia sử dụng Amazon Rekognition Video để xây dựng khả năng tìm kiếm video nâng cao cho video dạng dài

phương tiện tổng hợp là nhà cung cấp công nghệ video hàng đầu giải quyết nhu cầu cho các nhà cung cấp dịch vụ video cao cấp và dịch vụ trực tiếp đến người tiêu dùng (D2C) với danh mục giải pháp toàn diện. Các giải pháp của Synamedia trải rộng trên một số trụ cột như mạng video, nền tảng TV, quảng cáo và kiếm tiền cũng như bảo vệ nội dung và ngăn chặn vi phạm bản quyền.

Synamedia hợp tác với AWS để sử dụng trí tuệ nhân tạo (AI) nhằm phát triển khả năng tìm kiếm video nâng cao cho video dạng dài. Điều này nhằm hỗ trợ khách hàng của họ tìm kiếm video dựa trên mô tả về những cảnh không được mô tả trong siêu dữ liệu của nội dung. Ví dụ: tìm kiếm một video (ngay cả trong một loạt phim) có cảnh trên một chiếc thuyền không đủ quan trọng để được đề cập trong siêu dữ liệu. Điều này cho phép khám phá nội dung từ các đối tượng trong thế giới thực.

Với Video nhận dạng Amazon, Synamedia đã xây dựng một giải pháp AI có thể thực hiện phát hiện nhãn trong video và trong hình ảnh bằng cách sử dụng các mô hình tiêu chuẩn và tùy chỉnh. Điều này cho phép phát hiện mức độ cảnh của các đối tượng cụ thể trong video dạng dài, dựa trên những gì thực sự có trong cảnh tại thời điểm đó. Khả năng mới này cho phép người dùng tìm các lần xuất hiện cụ thể trong video dạng dài, chỉ dựa trên mô tả chung về những gì họ đang tìm kiếm. Điều này cho phép Synamedia hoạt động cực kỳ nhanh chóng khi tích hợp nội dung mới, hiện mất vài giờ để xoay vòng và nhận được kết quả. Giải pháp đơn giản để sử dụng và mở rộng bằng cách cung cấp khả năng thêm các mô hình tùy chỉnh khác cho hình ảnh theo miền cụ thể.

“Amazon Rekognition Video là một dịch vụ mạnh mẽ và dễ sử dụng. Nó đã cho chúng tôi quyền truy cập sẵn sàng vào khả năng thị giác máy tính tốt nhất trong lớp, chúng tôi có thể sử dụng để xây dựng và thử nghiệm các tính năng tìm kiếm video sáng tạo trong vài tuần nữa. ”

- Avi Fruchter, Thành viên Kỹ thuật Phần mềm tại Synamedia.

Sử dụng AI để lập chỉ mục nội dung trực quan

Khi cả nguồn cung cấp nội dung video và nhu cầu về thông tin chi tiết về video tiếp tục tăng lên, khả năng tìm kiếm video hiệu quả ngày càng trở nên quan trọng hơn. Tuy nhiên, tìm kiếm video truyền thống thường bị giới hạn ở thông tin cơ bản như tiêu đề video hoặc trong một số trường hợp, siêu dữ liệu được đính kèm dưới dạng thẻ mô tả chủ đề hoặc nội dung chính của video.

Hầu hết thông tin mô tả cần phải được thêm theo cách thủ công, nhưng điều này trở nên nghiêm trọng khi số lượng video tăng lên. Do đó, hiệu suất tìm kiếm video truyền thống thường bị hạn chế. Hạn chế này thậm chí còn rõ ràng hơn đối với nội dung video dạng dài, mà siêu dữ liệu cấp cảnh thường không tồn tại, do chi phí sản xuất tốn kém và tốn thời gian như thế nào.

Để giải quyết hạn chế này, Synamedia bắt đầu phát triển một giải pháp tìm kiếm video được hỗ trợ bởi AI sử dụng thị giác máy tính để tự động xác định các chi tiết ở cấp độ cảnh trong bất kỳ video nhất định nào và giúp người dùng có thể khám phá thông tin đó dựa trên các mô tả chung về những cảnh đó.

Sử dụng Amazon Rekognition để xây dựng giải pháp thị giác máy tính tùy chỉnh chỉ trong 2 tuần

Để đạt được mục tiêu này, Avi Fruchter, Thành viên Kỹ thuật Phần mềm của Synamedia, đã chuyển sang Nhận thức lại Amazon, Một dịch vụ phân tích video được quản lý đầy đủ điều đó giúp đẩy nhanh quá trình sử dụng các mô hình thị giác máy tính để phát hiện các trường hợp xuất hiện ở mức cảnh có liên quan như đối tượng, hoạt động và thậm chí cả văn bản và cảnh.

Amazon Rekognition Video đẩy nhanh sự phát triển của các giải pháp thị giác máy tính cho video bằng cách tự động xử lý và gắn thẻ nội dung video bằng các mô hình thị giác máy tính. Các mô hình này được quản lý và duy trì hoàn toàn bởi Amazon Rekognition. Nó loại bỏ những gánh nặng không phân biệt đối với việc quản lý cơ sở hạ tầng cần thiết và cũng làm giảm chuyên môn kỹ thuật cần thiết để xây dựng và triển khai các mô hình này.

Để bắt đầu, bạn chỉ cần chọn một loạt các khả năng của Amazon Rekognition có liên quan đến nhiệm vụ của bạn và gọi API có liên quan. Sau đó, kết quả được trả về dưới dạng phản hồi JSON dễ quản lý cho từng công việc.

Ví dụ: Synamedia đã sử dụng API StartLabelDetection để tự động tạo danh sách các nhãn cho các đối tượng được phát hiện trong mỗi khung video của thư viện video của họ. Từ lệnh gọi API đơn giản này, Amazon Rekognition đã trả về danh sách các nhãn, điểm tin cậy của từng nhãn và dấu thời gian có liên quan cho từng khung. Điều này cho phép Synamedia tạo ngay một bộ siêu dữ liệu tìm kiếm hoàn toàn mới cho mỗi video trong thư viện thử nghiệm của họ. Sau đó, người dùng có thể tìm kiếm nội dung video cụ thể chỉ bằng cách mô tả các đối tượng hoặc phong cảnh cụ thể mà họ quan tâm và nhận được kết quả không chỉ phù hợp với truy vấn của họ mà còn hướng họ đến cảnh cụ thể trong video có nội dung đó.

Các API Rekognition của Amazon có liên quan khác để phân tích video là StartFaceDetection, StartPersonTracking và StartSegmentDetection — một tính năng có thể xác định thời điểm mà các cảnh trong video thay đổi.

Amazon Rekognition hoạt động trên cả video quay trước và video trực tiếp. Video ghi trước được đọc từ Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) và video trực tiếp có thể được xử lý từ Luồng video Amazon Kinesis.

Synamedia đã chọn Amazon Rekogntion vì khả năng mở rộng nhanh chóng khả năng của họ. Nhóm đổi mới của Synamedia chỉ dành riêng cho việc xây dựng các cải tiến kỹ thuật mới trong video và có chuyên môn kỹ thuật vững vàng. Tuy nhiên, ngay cả đối với họ, không phải lúc nào bạn cũng có thể có chuyên môn sâu về lĩnh vực trong tất cả các lĩnh vực công nghệ video. Tham gia Amazon Rekogntion, công ty đã mở rộng khả năng của họ về thị giác máy tính, cho phép họ hình thành khái niệm về một trường hợp sử dụng và nhanh chóng kiểm tra khả năng tồn tại của nó.

Avi Fruchter nói: “Quá trình bắt đầu diễn ra cực kỳ nhanh chóng và kết quả thu được cực kỳ nhanh chóng. “Không phải lúc nào chúng tôi cũng là chuyên gia miền trong tất cả các lĩnh vực ML và Amazon Rekognition cho chúng tôi khả năng tận dụng kiến thức chuyên môn hiện có của mình vào các loại trường hợp sử dụng nâng cao mới cho khách hàng của chúng tôi.”

Synamedia dự đoán giải pháp của họ sẽ mang lại nhiều lợi ích cho nhiều đối tượng khách hàng, bao gồm các công ty có thư viện video lớn cũng như ngày càng nhiều công ty cần theo dõi các sự kiện cụ thể trong nguồn cấp dữ liệu video trực tiếp, chẳng hạn như rủi ro về sức khỏe và an toàn.

Tổng kết

Với Amazon Rekognition Video, Synamedia có thể xây dựng và kiểm tra khả năng tìm kiếm video nâng cao trong vài tuần mà không cần thuê hoặc phát triển thêm chuyên môn về thị giác máy tính.

Khả năng mới này đã cho phép Synamedia mở rộng tầm ảnh hưởng của nhóm đổi mới và tiếp tục sứ mệnh thúc đẩy đổi mới video mới cho khách hàng của mình.

Tìm hiểu thêm về cách bạn có thể nhanh chóng xây dựng các giải pháp thị giác máy tính nâng cao cho video bằng cách truy cập Video nhận dạng Amazon hoặc đề cập đến Tài nguyên của Amazon Rekognition.

Giới thiệu về tác giả

Daniel Burke là công ty dẫn đầu Châu Âu về AI và ML trong nhóm Công ty tư nhân tại AWS. Daniel làm việc trực tiếp với các quỹ Private Equity và các công ty trong danh mục đầu tư của họ, giúp họ đẩy nhanh việc áp dụng AI và ML để cải thiện sự đổi mới và tăng giá trị doanh nghiệp.

John Shaw là công ty dẫn đầu về AI và ML ở Bắc Mỹ trong nhóm Công ty tư nhân tại AWS. John làm việc trực tiếp với các quỹ Private Equity và các công ty trong danh mục đầu tư của họ, giúp họ đẩy nhanh việc áp dụng AI và ML để cải thiện sự đổi mới và tăng giá trị doanh nghiệp.

Trí thông minh dữ liệu tạo

Cách Synamedia sử dụng Amazon Rekognition Video để xây dựng khả năng tìm kiếm video nâng cao cho video dạng dài

Sử dụng AI để lập chỉ mục nội dung trực quan

Sử dụng Amazon Rekognition để xây dựng giải pháp thị giác máy tính tùy chỉnh chỉ trong 2 tuần

Tổng kết

Giới thiệu về tác giả

Cách chọn Cơ quan phát triển Shopify tốt nhất cho doanh nghiệp của bạn

Bảo mật thông tin cá nhân: Mẹo bảo vệ PII hàng đầu

Tin tức mới nhất

Triển vọng EUR/USD: Các công ty sử dụng đồng đô la trước cuộc họp FOMC quan trọng

EUR/USD giảm lỗ vào ngày sau dữ liệu lạm phát của Eurozone | Forexlive

Cá cược đua ngựa ở Canada

GDP sơ bộ Q1 của Eurozone +0.3% so với +0.1% q/q dự kiến | Forexlive

Dự án nghiên cứu miễn dịch-ung thư mới hợp tác với Merck bắt đầu tại Viện BioMed X ở Heidelberg

Giải thích nhiều người chơi Bellwright