Sora, un nouveau modèle vidéo génératif impressionnant créé par OpenAI, peut prendre une brève description textuelle et la transformer en un clip vidéo complexe et haute définition d'une minute.
OpenAI, la société mère du chatbot ChatGPT et du générateur d'images fixes DALL-E, fait partie des nombreuses entreprises en lice pour améliorer ce générateur de vidéo instantanée. D'autres sociétés incluent des start-ups comme Runway et des géants de la technologie comme Google et Meta Platforms Inc., propriétaires de Facebook et Instagram.
La technologie a le potentiel de remplacer complètement les artistes numériques moins qualifiés tout en accélérant le travail des cinéastes chevronnés.
Lisez aussi: Le co-fondateur d'OpenAI, Andrej Karpathy, démissionne et envisage des projets personnels
Présentation de Sora, notre modèle texte-vidéo.
Sora peut créer des vidéos d'une durée maximale de 60 secondes présentant des scènes très détaillées, des mouvements de caméra complexes et plusieurs personnages aux émotions vibrantes. https://t.co/7j2JN27M3W
Invite : "Beau, enneigé... pic.twitter.com/ruTEWn87vf
- OpenAI (@OpenAI) 15 février 2024
Libérer Sora
OpenAI a nommé son nouveau système Sora, le mot japonais signifiant ciel. L'équipe de développement de la technologie, composée des chercheurs Tim Brooks et Bill Peebles, a choisi ce nom car il « évoque l'idée d'un potentiel créatif illimité ».
Sora est notre premier modèle de génération vidéo : il peut créer des vidéos HD d'une durée maximale d'une minute. AGI sera capable de simuler le monde physique, et Sora constitue une étape clé dans cette direction. ravi d'avoir travaillé là-dessus avec @billpeeb at @openai depuis un an https://t.co/p4kAkRR0i0 pic.twitter.com/Hipku1LFRM
-Tim Brooks (@_tim_brooks) 15 février 2024
Ils ont également déclaré que la société n'avait pas encore rendu public Sora car elle étudiait toujours les risques associés au système. Au lieu de cela, OpenAI partage la technologie avec un groupe sélectionné d'universitaires et d'autres chercheurs externes qui la « équipe rouge », un terme pour décrire la recherche d'utilisations abusives potentielles.
Selon le Dr Brooks, l'intention ici est de donner un aperçu de ce qui se profile à l'horizon afin que les gens puissent voir les capacités de cette technologie et obtenir des commentaires.
OpenAI balise les vidéos
OpenAI marque déjà les vidéos créées par le système avec des filigranes pour indiquer qu'elles ont été générées par l'intelligence artificielle (IA). Cependant, l’entreprise reconnaît que ceux-ci peuvent être supprimés. Ils ont ajouté qu’ils peuvent également être difficiles à identifier.
Selon OpenAI, ils enseignent l'intelligence artificielle (IA) pour comprendre et simuler le monde physique en mouvement, dans le but de former des modèles qui aident les gens à résoudre des problèmes nécessitant une interaction dans le monde réel.
De plus, ils donnent accès à plusieurs artistes visuels, designers et cinéastes pour obtenir des commentaires sur la manière de faire progresser le modèle afin qu'il soit le plus utile possible aux professionnels de la création.
voici sora, notre modèle de génération vidéo :https://t.co/CDr4DdCrh1
aujourd'hui, nous lançons le red-teaming et offrons l'accès à un nombre limité de créateurs.@_tim_brooks @billpeeb @model_mechanic sont vraiment incroyables ; travail incroyable de leur part et de l'équipe.
moment remarquable.
- Sam Altman (@sama) 15 février 2024
Ils partagent très tôt les progrès de leurs recherches pour commencer à travailler avec des personnes extérieures à OpenAI et à obtenir leurs commentaires, et pour donner au public une idée des capacités de l'IA à l'horizon.
Développer Sora
Toutefois, OpenAI a refusé de divulguer le nombre de vidéos à partir desquelles le système a appris ou d'où elles proviennent. Ils ont seulement déclaré que la formation comprenait à la fois des vidéos accessibles au public et des vidéos sous licence par les détenteurs de droits d'auteur.
La société a été poursuivie à plusieurs reprises pour avoir utilisé du contenu protégé par le droit d'auteur. Il essaie probablement de conserver un avantage sur ses concurrents, c'est pourquoi il ne divulgue rien sur les données utilisées pour former ses technologies.
De plus, le modèle possède une compréhension approfondie du langage, ce qui lui permet d'interpréter avec précision les invites et de générer des personnages convaincants qui transmettent de manière vivante des émotions. Sora peut également provoquer plusieurs plans qui conservent le plan visuel et le personnage au sein d'une vidéo générée unique.
OpenAI a partagé l'invite à générer une vidéo sur son identifiant X, provoquant plusieurs réactions de la part des utilisateurs X.
Invite : « Une femme élégante marche dans une rue de Tokyo remplie de néons chaleureux et de panneaux urbains animés. elle porte une veste en cuir noire, une longue robe rouge et des bottes noires et porte un sac à main noir. elle porte des lunettes de soleil et du rouge à lèvres. elle marche avec confiance et avec désinvolture.… pic.twitter.com/cjIdgYFaWq
- OpenAI (@OpenAI) 15 février 2024
Les faiblesses du modèle
Selon OpenAI, le modèle actuel présente des faiblesses. Il peut avoir besoin d'aide pour simuler avec précision la physique d'une scène complexe et peut avoir besoin d'aide pour comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut mordre un cookie, mais par la suite, le cookie peut ne pas avoir de marque de morsure.
Le modèle peut également avoir besoin de clarifier les détails spatiaux d'une invite, par exemple en mélangeant gauche et droite, et peut avoir besoin d'aide pour des descriptions précises d'événements qui se déroulent au fil du temps, comme suivre une trajectoire de caméra spécifique.
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
- PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
- PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
- PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
- La source: https://metanews.com/openai-presents-ai-that-produces-eye-popping-videos-instantly/