Zephyrnet-logo

Sora AI produceert direct oogverblindende video's

Datum:

Sora, een indrukwekkend nieuw generatief videomodel gemaakt door OpenAI, kan een korte tekstbeschrijving omzetten in een ingewikkelde high-definition filmclip van een minuut.

OpenAI, het moederbedrijf van de ChatGPT-chatbot en de stilstaand-beeldgenerator DALL-E, is een van de vele bedrijven die strijden om deze instant videogenerator te verbeteren. Andere bedrijven zijn start-ups als Runway en technologiegiganten als Google en Meta Platforms Inc., de eigenaren van Facebook en Instagram.

De technologie heeft het potentieel om minder ervaren digitale artiesten volledig te vervangen en tegelijkertijd het werk van doorgewinterde filmmakers te versnellen.

Lees ook: Medeoprichter van OpenAI, Andrej Karpathy, treedt af bij Eyes Personal Ventures

Sora vrijlaten

OpenAI noemde zijn nieuwe systeem Sora, het Japanse woord voor lucht. Het ontwikkelingsteam van de technologie, waaronder de onderzoekers Tim Brooks en Bill Peebles, koos de naam omdat deze “het idee oproept van grenzeloos creatief potentieel.”

Ze zeiden ook dat het bedrijf Sora nog niet aan het publiek had vrijgegeven omdat het nog steeds onderzoek deed naar de risico's die aan het systeem verbonden waren. In plaats daarvan deelt OpenAI de technologie met een geselecteerde groep academici en andere externe onderzoekers die er een ‘red team’ van zullen maken, een term om het zoeken naar mogelijk misbruik te beschrijven.

Volgens Dr. Brooks is het de bedoeling hier een voorproefje te geven van wat er aan de horizon staat, zodat mensen de mogelijkheden van deze technologie kunnen zien en feedback kunnen krijgen.

OpenAI tagt de video's

OpenAI tagt video's die door het systeem zijn gemaakt al met watermerken om aan te geven dat ze zijn gegenereerd door kunstmatige intelligentie (AI). Het bedrijf erkent echter dat deze kunnen worden verwijderd. Ze voegden eraan toe dat ze ook een uitdaging kunnen zijn om te identificeren.

Think OpenAI, leren ze kunstmatige intelligentie (AI) om de fysieke wereld in beweging te begrijpen en te simuleren, met als doel modellen te trainen die mensen helpen problemen op te lossen die interactie in de echte wereld vereisen.

Daarnaast verlenen ze toegang aan verschillende beeldend kunstenaars, ontwerpers en filmmakers om feedback te krijgen over hoe het model verder ontwikkeld kan worden, zodat het zo nuttig mogelijk is voor creatieve professionals.

Ze delen hun onderzoeksvoortgang al vroeg om te gaan werken met en feedback te krijgen van mensen buiten OpenAI en om het publiek een idee te geven van de AI-mogelijkheden die in het verschiet liggen.

Sora ontwikkelen

Echter, OpenAI weigerde bekend te maken hoeveel video's het systeem heeft geleerd en waar deze vandaan komen. Ze verklaarden alleen dat de training zowel publiekelijk beschikbare video's als video's omvatte waarvoor auteursrechthouders een licentie hadden.

Het bedrijf is meerdere keren aangeklaagd wegens het gebruik van auteursrechtelijk beschermde inhoud. Het probeert waarschijnlijk een voorsprong op de concurrentie te behouden, dus maakt het niets bekend over de gegevens die worden gebruikt om zijn technologieën te trainen.

Bovendien heeft het model een diepgaand taalbegrip, waardoor het aanwijzingen accuraat kan interpreteren en overtuigende karakters kan genereren die emoties levendig overbrengen. Sora kan ook meerdere opnames maken die de visuele opname en het karakter binnen één gegenereerde video behouden.

OpenAI deelde de prompt om een ​​video op hun X-handle te genereren, wat verschillende reacties van X-gebruikers veroorzaakte.

De zwakke punten van het model

Volgens OpenAI heeft het huidige model zwakke punten. Het kan hulp nodig hebben bij het nauwkeurig simuleren van de fysica van een complexe scène en kan hulp nodig hebben bij het begrijpen van specifieke gevallen van oorzaak en gevolg. Een persoon kan bijvoorbeeld in een koekje bijten, maar daarna is het mogelijk dat het koekje geen bijtafdruk meer heeft.

Het model moet mogelijk ook de ruimtelijke details van een prompt verduidelijken, bijvoorbeeld door links en rechts door elkaar te halen, en heeft mogelijk hulp nodig bij nauwkeurige beschrijvingen van gebeurtenissen die in de loop van de tijd plaatsvinden, zoals het volgen van een specifiek cameratraject.

spot_img

Laatste intelligentie

spot_img