Logo Zéphyrnet

Sora AI produit instantanément des vidéos époustouflantes

Date :

Sora, un nouveau modèle vidéo génératif impressionnant créé par OpenAI, peut prendre une brève description textuelle et la transformer en un clip vidéo complexe et haute définition d'une minute.

OpenAI, la société mère du chatbot ChatGPT et du générateur d'images fixes DALL-E, fait partie des nombreuses entreprises en lice pour améliorer ce générateur de vidéo instantanée. D'autres sociétés incluent des start-ups comme Runway et des géants de la technologie comme Google et Meta Platforms Inc., propriétaires de Facebook et Instagram.

La technologie a le potentiel de remplacer complètement les artistes numériques moins qualifiés tout en accélérant le travail des cinéastes chevronnés.

Lisez aussi: Le co-fondateur d'OpenAI, Andrej Karpathy, démissionne et envisage des projets personnels

Libérer Sora

OpenAI a nommé son nouveau système Sora, le mot japonais signifiant ciel. L'équipe de développement de la technologie, composée des chercheurs Tim Brooks et Bill Peebles, a choisi ce nom car il « évoque l'idée d'un potentiel créatif illimité ».

Ils ont également déclaré que la société n'avait pas encore rendu public Sora car elle étudiait toujours les risques associés au système. Au lieu de cela, OpenAI partage la technologie avec un groupe sélectionné d'universitaires et d'autres chercheurs externes qui la « équipe rouge », un terme pour décrire la recherche d'utilisations abusives potentielles.

Selon le Dr Brooks, l'intention ici est de donner un aperçu de ce qui se profile à l'horizon afin que les gens puissent voir les capacités de cette technologie et obtenir des commentaires.

OpenAI balise les vidéos

OpenAI marque déjà les vidéos créées par le système avec des filigranes pour indiquer qu'elles ont été générées par l'intelligence artificielle (IA). Cependant, l’entreprise reconnaît que ceux-ci peuvent être supprimés. Ils ont ajouté qu’ils peuvent également être difficiles à identifier.

Selon OpenAI, ils enseignent l'intelligence artificielle (IA) pour comprendre et simuler le monde physique en mouvement, dans le but de former des modèles qui aident les gens à résoudre des problèmes nécessitant une interaction dans le monde réel.

De plus, ils donnent accès à plusieurs artistes visuels, designers et cinéastes pour obtenir des commentaires sur la manière de faire progresser le modèle afin qu'il soit le plus utile possible aux professionnels de la création.

Ils partagent très tôt les progrès de leurs recherches pour commencer à travailler avec des personnes extérieures à OpenAI et à obtenir leurs commentaires, et pour donner au public une idée des capacités de l'IA à l'horizon.

Développer Sora

Toutefois, OpenAI a refusé de divulguer le nombre de vidéos à partir desquelles le système a appris ou d'où elles proviennent. Ils ont seulement déclaré que la formation comprenait à la fois des vidéos accessibles au public et des vidéos sous licence par les détenteurs de droits d'auteur.

La société a été poursuivie à plusieurs reprises pour avoir utilisé du contenu protégé par le droit d'auteur. Il essaie probablement de conserver un avantage sur ses concurrents, c'est pourquoi il ne divulgue rien sur les données utilisées pour former ses technologies.

De plus, le modèle possède une compréhension approfondie du langage, ce qui lui permet d'interpréter avec précision les invites et de générer des personnages convaincants qui transmettent de manière vivante des émotions. Sora peut également provoquer plusieurs plans qui conservent le plan visuel et le personnage au sein d'une vidéo générée unique.

OpenAI a partagé l'invite à générer une vidéo sur son identifiant X, provoquant plusieurs réactions de la part des utilisateurs X.

Les faiblesses du modèle

Selon OpenAI, le modèle actuel présente des faiblesses. Il peut avoir besoin d'aide pour simuler avec précision la physique d'une scène complexe et peut avoir besoin d'aide pour comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut mordre un cookie, mais par la suite, le cookie peut ne pas avoir de marque de morsure.

Le modèle peut également avoir besoin de clarifier les détails spatiaux d'une invite, par exemple en mélangeant gauche et droite, et peut avoir besoin d'aide pour des descriptions précises d'événements qui se déroulent au fil du temps, comme suivre une trajectoire de caméra spécifique.

spot_img

Dernières informations

spot_img