Logo Zephyrnet

Sora AI tạo ra những video bắt mắt ngay lập tức

Ngày:

Sora, một mô hình video tổng hợp mới đầy ấn tượng do OpenAI tạo ra, có thể lấy một mô tả văn bản ngắn gọn và biến nó thành một đoạn phim độ phân giải cao, phức tạp, dài một phút.

OpenAI, công ty mẹ của chatbot ChatGPT và trình tạo ảnh tĩnh DALL-E, nằm trong số nhiều công ty đang cạnh tranh để cải tiến trình tạo video tức thời này. Các công ty khác bao gồm các công ty khởi nghiệp như Runway và những gã khổng lồ công nghệ như Google và Meta Platforms Inc., chủ sở hữu của Facebook và Instagram.

Công nghệ này có tiềm năng thay thế hoàn toàn các nghệ sĩ kỹ thuật số kém tay nghề hơn, đồng thời đẩy nhanh tốc độ làm việc của các nhà làm phim dày dạn kinh nghiệm.

Cũng đọc: Người đồng sáng lập OpenAI, Andrej Karpathy, Steps Down, Eyes Personal Ventures

Giải phóng Sora

OpenAI đặt tên cho hệ thống mới của mình là Sora, từ tiếng Nhật có nghĩa là bầu trời. Nhóm phát triển công nghệ, bao gồm các nhà nghiên cứu Tim Brooks và Bill Peebles, đã chọn cái tên này vì nó “gợi lên ý tưởng về tiềm năng sáng tạo vô hạn”.

Họ cũng cho biết công ty vẫn chưa phát hành Sora ra công chúng vì họ vẫn đang xem xét các rủi ro liên quan đến hệ thống. Đúng hơn, OpenAI đang chia sẻ công nghệ này với một nhóm học giả được chọn và các nhà nghiên cứu bên ngoài khác, những người sẽ “đội đỏ” nó, một thuật ngữ mô tả việc tìm kiếm các hành vi lạm dụng tiềm ẩn.

Theo Tiến sĩ Brooks, mục đích ở đây là đưa ra một bản xem trước về những gì sắp xảy ra để mọi người có thể thấy được khả năng của công nghệ này và nhận phản hồi.

OpenAI Gắn thẻ các video

OpenAI đã gắn thẻ các video do hệ thống tạo bằng hình mờ để cho biết chúng được tạo bởi trí tuệ nhân tạo (AI). Tuy nhiên, công ty thừa nhận rằng những điều này có thể được loại bỏ. Họ nói thêm rằng việc xác định cũng có thể gặp khó khăn.

Theo OpenAI, họ đang dạy trí tuệ nhân tạo (AI) để hiểu và mô phỏng thế giới vật chất đang chuyển động, với mục tiêu đào tạo các mô hình giúp con người giải quyết các vấn đề đòi hỏi sự tương tác trong thế giới thực.

Ngoài ra, họ đang cấp quyền truy cập cho một số nghệ sĩ thị giác, nhà thiết kế và nhà làm phim để nhận phản hồi về cách cải tiến mô hình sao cho hữu ích nhất cho các chuyên gia sáng tạo.

Họ đang sớm chia sẻ tiến trình nghiên cứu của mình để bắt đầu hợp tác và nhận phản hồi từ những người bên ngoài OpenAI, đồng thời giúp công chúng hiểu được những khả năng của AI sắp ra mắt.

Phát triển Sora

Tuy vậy, OpenAI từ chối tiết lộ số lượng video mà hệ thống đã học được hoặc chúng đến từ đâu. Họ chỉ tuyên bố rằng khóa đào tạo bao gồm cả video có sẵn công khai và video được chủ bản quyền cấp phép.

Công ty đã bị kiện nhiều lần vì sử dụng nội dung có bản quyền. Có lẽ họ đang cố gắng giữ lợi thế trước các đối thủ cạnh tranh nên không tiết lộ bất cứ điều gì về dữ liệu được sử dụng để đào tạo công nghệ của mình.

Hơn nữa, mô hình có khả năng hiểu biết sâu sắc về ngôn ngữ, cho phép diễn giải chính xác các lời nhắc và tạo ra các nhân vật hấp dẫn truyền tải cảm xúc một cách sống động. Sora cũng có thể tạo ra một số cảnh quay để duy trì hình ảnh và nhân vật trong một video được tạo đơn lẻ.

OpenAI đã chia sẻ lời nhắc tạo video trên tay cầm X của họ, gây ra một số phản ứng từ người dùng X.

Điểm yếu của mô hình

Theo OpenAI, mô hình hiện tại có điểm yếu. Nó có thể cần trợ giúp để mô phỏng chính xác tính chất vật lý của một khung cảnh phức tạp và có thể cần trợ giúp để hiểu các trường hợp cụ thể về nguyên nhân và kết quả. Ví dụ, một người có thể cắn một chiếc bánh quy, nhưng sau đó chiếc bánh quy đó có thể không có vết cắn.

Mô hình cũng có thể cần làm rõ các chi tiết không gian của lời nhắc, chẳng hạn như trộn lẫn trái và phải và có thể cần trợ giúp bằng các mô tả chính xác về các sự kiện diễn ra theo thời gian, chẳng hạn như đi theo một quỹ đạo camera cụ thể.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img