Sora, ein beeindruckendes neues generatives Videomodell von OpenAI, kann eine kurze Textbeschreibung in einen minutenlangen, komplexen, hochauflösenden Filmclip umwandeln.
OpenAI, die Muttergesellschaft des ChatGPT-Chatbots und des Standbildgenerators DALL-E, gehört zu den vielen Unternehmen, die an der Verbesserung dieses Instant-Videogenerators wetteifern. Zu den weiteren Unternehmen zählen Start-ups wie Runway und Technologiegiganten wie Google und Meta Platforms Inc., die Eigentümer von Facebook und Instagram.
Die Technologie hat das Potenzial, weniger erfahrene Digitalkünstler vollständig zu ersetzen und gleichzeitig die Arbeit erfahrener Filmemacher zu beschleunigen.
Lesen Sie auch: Der Mitbegründer von OpenAI, Andrej Karpathy, tritt zurück und blickt auf Personal Ventures
Wir stellen Ihnen Sora vor, unser Text-zu-Video-Modell.
Sora kann bis zu 60 Sekunden lange Videos mit äußerst detaillierten Szenen, komplexen Kamerabewegungen und mehreren Charakteren mit lebendigen Emotionen erstellen. https://t.co/7j2JN27M3W
Aufforderung: „Wunderschön, verschneit...“ pic.twitter.com/ruTEWn87vf
- OpenAI (@OpenAI) 15. Februar 2024
Sora freilassen
OpenAI nannte sein neues System Sora, das japanische Wort für Himmel. Das Entwicklungsteam der Technologie, darunter die Forscher Tim Brooks und Bill Peebles, wählte den Namen, weil er „die Idee eines grenzenlosen kreativen Potenzials hervorruft“.
Sora ist unser erstes Videogenerationsmodell – es kann HD-Videos mit einer Länge von bis zu 1 Minute erstellen. AGI wird in der Lage sein, die physische Welt zu simulieren, und Sora ist ein wichtiger Schritt in diese Richtung. Ich bin begeistert, mit diesem zusammengearbeitet zu haben @billpeeb at @openai für das vergangene Jahr https://t.co/p4kAkRR0i0 pic.twitter.com/Hipku1LFRM
— Tim Brooks (@_tim_brooks) 15. Februar 2024
Sie sagten auch, dass das Unternehmen Sora noch nicht der Öffentlichkeit zugänglich gemacht habe, da es noch die mit dem System verbundenen Risiken prüfe. Vielmehr teilt OpenAI die Technologie mit einer ausgewählten Gruppe von Akademikern und anderen externen Forschern, die sie in einem „Red Team“ zusammenfassen, ein Begriff, der die Suche nach potenziellem Missbrauch beschreibt.
Laut Dr. Brooks besteht die Absicht hier darin, eine Vorschau auf das zu geben, was sich am Horizont abzeichnet, damit die Menschen die Fähigkeiten dieser Technologie erkennen und Feedback erhalten können.
OpenAI markiert die Videos
OpenAI markiert vom System erstellte Videos bereits mit Wasserzeichen, um anzuzeigen, dass sie durch künstliche Intelligenz (KI) generiert wurden. Das Unternehmen erkennt jedoch an, dass diese entfernt werden können. Sie fügten hinzu, dass es auch schwierig sein kann, sie zu identifizieren.
Laut OpenAISie lehren künstliche Intelligenz (KI), die physische Welt in Bewegung zu verstehen und zu simulieren, mit dem Ziel, Modelle zu trainieren, die Menschen bei der Lösung von Problemen helfen, die eine Interaktion in der realen Welt erfordern.
Darüber hinaus gewähren sie Zugang zu mehreren bildenden Künstlern, Designern und Filmemachern, um Feedback dazu zu erhalten, wie das Modell so weiterentwickelt werden kann, dass es für Kreativprofis am hilfreichsten ist.
Hier ist Sora, unser Videogenerierungsmodell:https://t.co/CDr4DdCrh1
Heute beginnen wir mit dem Red-Teaming und bieten einer begrenzten Anzahl von Erstellern Zugang.@_tim_brooks @billpeeb @model_mechanic sind wirklich unglaublich; tolle Arbeit von ihnen und dem Team.
bemerkenswerter Moment.
– Sam Altman (@sama) 15. Februar 2024
Sie teilen ihre Forschungsfortschritte frühzeitig mit, um mit Menschen außerhalb von OpenAI zusammenzuarbeiten und Feedback von ihnen zu erhalten und der Öffentlichkeit einen Eindruck davon zu vermitteln, welche KI-Fähigkeiten sich am Horizont abzeichnen.
Sora entwickeln
Aber, OpenAI weigerte sich, die Anzahl der Videos offenzulegen, aus denen das System gelernt hatte, oder woher sie kamen. Sie gaben lediglich an, dass die Schulung sowohl öffentlich verfügbare Videos als auch von Urheberrechtsinhabern lizenzierte Videos umfasste.
Das Unternehmen wurde mehrfach wegen der Verwendung urheberrechtlich geschützter Inhalte verklagt. Es versucht wahrscheinlich, einen Vorsprung gegenüber der Konkurrenz zu behalten, und gibt daher nichts über die Daten preis, die zum Trainieren seiner Technologien verwendet werden.
Darüber hinaus verfügt das Modell über ein umfassendes Sprachverständnis, das es ihm ermöglicht, Aufforderungen genau zu interpretieren und überzeugende Charaktere zu generieren, die Emotionen anschaulich vermitteln. Sora kann auch mehrere Aufnahmen erstellen, die die visuelle Aufnahme und den Charakter innerhalb eines einzelnen generierten Videos beibehalten.
OpenAI teilte die Aufforderung mit, ein Video auf seinem X-Handle zu erstellen, was mehrere Reaktionen von X-Benutzern hervorrief.
Aufforderung: „Eine stilvolle Frau geht eine Straße in Tokio entlang, die mit warm leuchtendem Neon und animierten Stadtschildern gefüllt ist. Sie trägt eine schwarze Lederjacke, ein langes rotes Kleid und schwarze Stiefel und trägt eine schwarze Handtasche. Sie trägt eine Sonnenbrille und roten Lippenstift. Sie geht selbstbewusst und lässig.… pic.twitter.com/cjIdgYFaWq
- OpenAI (@OpenAI) 15. Februar 2024
Die Schwächen des Modells
Laut OpenAI weist das aktuelle Modell Schwächen auf. Es benötigt möglicherweise Hilfe bei der genauen Simulation der Physik einer komplexen Szene und benötigt möglicherweise Hilfe beim Verständnis spezifischer Fälle von Ursache und Wirkung. Beispielsweise könnte eine Person in einen Keks beißen, der Keks hinterher aber möglicherweise keine Bissspur mehr aufweist.
Das Modell muss möglicherweise auch die räumlichen Details einer Eingabeaufforderung klären, z. B. die Verwechslung von links und rechts, und benötigt möglicherweise Hilfe bei der genauen Beschreibung von Ereignissen, die im Laufe der Zeit stattfinden, z. B. beim Verfolgen einer bestimmten Kamerabahn.
- SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
- PlatoData.Network Vertikale generative KI. Motiviere dich selbst. Hier zugreifen.
- PlatoAiStream. Web3-Intelligenz. Wissen verstärkt. Hier zugreifen.
- PlatoESG. Kohlenstoff, CleanTech, Energie, Umwelt, Solar, Abfallwirtschaft. Hier zugreifen.
- PlatoHealth. Informationen zu Biotechnologie und klinischen Studien. Hier zugreifen.
- Quelle: https://metanews.com/openai-presents-ai-that-produces-eye-popping-videos-instantly/