Sora, een indrukwekkend nieuw generatief videomodel gemaakt door OpenAI, kan een korte tekstbeschrijving omzetten in een ingewikkelde high-definition filmclip van een minuut.
OpenAI, het moederbedrijf van de ChatGPT-chatbot en de stilstaand-beeldgenerator DALL-E, is een van de vele bedrijven die strijden om deze instant videogenerator te verbeteren. Andere bedrijven zijn start-ups als Runway en technologiegiganten als Google en Meta Platforms Inc., de eigenaren van Facebook en Instagram.
De technologie heeft het potentieel om minder ervaren digitale artiesten volledig te vervangen en tegelijkertijd het werk van doorgewinterde filmmakers te versnellen.
Lees ook: Medeoprichter van OpenAI, Andrej Karpathy, treedt af bij Eyes Personal Ventures
Maak kennis met Sora, ons tekst-naar-video-model.
Sora kan video's van maximaal 60 seconden maken met zeer gedetailleerde scènes, complexe camerabewegingen en meerdere personages met levendige emoties. https://t.co/7j2JN27M3W
Prompt: "Mooi, besneeuwd... pic.twitter.com/ruTEWn87vf
- OpenAI (@OpenAI) 15 februari 2024
Sora vrijlaten
OpenAI noemde zijn nieuwe systeem Sora, het Japanse woord voor lucht. Het ontwikkelingsteam van de technologie, waaronder de onderzoekers Tim Brooks en Bill Peebles, koos de naam omdat deze “het idee oproept van grenzeloos creatief potentieel.”
Sora is ons eerste videogeneratiemodel – het kan HD-video's van maximaal 1 minuut maken. AGI zal de fysieke wereld kunnen simuleren, en Sora is een belangrijke stap in die richting. blij om hieraan mee te hebben gewerkt @billpeeb at @openai voor het afgelopen jaar https://t.co/p4kAkRR0i0 pic.twitter.com/Hipku1LFRM
— Tim Brooks (@_tim_brooks) 15 februari 2024
Ze zeiden ook dat het bedrijf Sora nog niet aan het publiek had vrijgegeven omdat het nog steeds onderzoek deed naar de risico's die aan het systeem verbonden waren. In plaats daarvan deelt OpenAI de technologie met een geselecteerde groep academici en andere externe onderzoekers die er een ‘red team’ van zullen maken, een term om het zoeken naar mogelijk misbruik te beschrijven.
Volgens Dr. Brooks is het de bedoeling hier een voorproefje te geven van wat er aan de horizon staat, zodat mensen de mogelijkheden van deze technologie kunnen zien en feedback kunnen krijgen.
OpenAI tagt de video's
OpenAI tagt video's die door het systeem zijn gemaakt al met watermerken om aan te geven dat ze zijn gegenereerd door kunstmatige intelligentie (AI). Het bedrijf erkent echter dat deze kunnen worden verwijderd. Ze voegden eraan toe dat ze ook een uitdaging kunnen zijn om te identificeren.
Think OpenAI, leren ze kunstmatige intelligentie (AI) om de fysieke wereld in beweging te begrijpen en te simuleren, met als doel modellen te trainen die mensen helpen problemen op te lossen die interactie in de echte wereld vereisen.
Daarnaast verlenen ze toegang aan verschillende beeldend kunstenaars, ontwerpers en filmmakers om feedback te krijgen over hoe het model verder ontwikkeld kan worden, zodat het zo nuttig mogelijk is voor creatieve professionals.
hier is sora, ons videogeneratiemodel:https://t.co/CDr4DdCrh1
vandaag starten we met red-teaming en bieden we toegang aan een beperkt aantal makers.@_tim_brooks @billpeeb @model_monteur zijn echt ongelooflijk; geweldig werk van hen en het team.
opmerkelijk moment.
- Sam Altman (@sama) 15 februari 2024
Ze delen hun onderzoeksvoortgang al vroeg om te gaan werken met en feedback te krijgen van mensen buiten OpenAI en om het publiek een idee te geven van de AI-mogelijkheden die in het verschiet liggen.
Sora ontwikkelen
Echter, OpenAI weigerde bekend te maken hoeveel video's het systeem heeft geleerd en waar deze vandaan komen. Ze verklaarden alleen dat de training zowel publiekelijk beschikbare video's als video's omvatte waarvoor auteursrechthouders een licentie hadden.
Het bedrijf is meerdere keren aangeklaagd wegens het gebruik van auteursrechtelijk beschermde inhoud. Het probeert waarschijnlijk een voorsprong op de concurrentie te behouden, dus maakt het niets bekend over de gegevens die worden gebruikt om zijn technologieën te trainen.
Bovendien heeft het model een diepgaand taalbegrip, waardoor het aanwijzingen accuraat kan interpreteren en overtuigende karakters kan genereren die emoties levendig overbrengen. Sora kan ook meerdere opnames maken die de visuele opname en het karakter binnen één gegenereerde video behouden.
OpenAI deelde de prompt om een video op hun X-handle te genereren, wat verschillende reacties van X-gebruikers veroorzaakte.
Vraag: “Een stijlvolle vrouw loopt door een straat in Tokio vol warm gloeiend neon en geanimeerde stadsborden. ze draagt een zwart leren jasje, een lange rode jurk en zwarte laarzen, en heeft een zwarte tas bij zich. ze draagt een zonnebril en rode lippenstift. ze loopt zelfverzekerd en nonchalant.… pic.twitter.com/cjIdgYFaWq
- OpenAI (@OpenAI) 15 februari 2024
De zwakke punten van het model
Volgens OpenAI heeft het huidige model zwakke punten. Het kan hulp nodig hebben bij het nauwkeurig simuleren van de fysica van een complexe scène en kan hulp nodig hebben bij het begrijpen van specifieke gevallen van oorzaak en gevolg. Een persoon kan bijvoorbeeld in een koekje bijten, maar daarna is het mogelijk dat het koekje geen bijtafdruk meer heeft.
Het model moet mogelijk ook de ruimtelijke details van een prompt verduidelijken, bijvoorbeeld door links en rechts door elkaar te halen, en heeft mogelijk hulp nodig bij nauwkeurige beschrijvingen van gebeurtenissen die in de loop van de tijd plaatsvinden, zoals het volgen van een specifiek cameratraject.
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
- PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
- PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
- Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
- Bron: https://metanews.com/openai-presents-ai-that-produces-eye-popping-videos-instantly/