Zephyrnet-logo

Sora: Wat docenten moeten weten over de videoversie van ChatGPT

Datum:

Als je je ooit hebt afgevraagd wat er zou gebeuren als ChatGPT video's zou kunnen maken, dan sta je op het punt je antwoord te krijgen. 

Sora is een nieuwe tool voor het genereren van AI-video's die onlangs is aangekondigd door OpenAI, de door Microsoft ondersteunde maker van ChatGPT. Hoewel het momenteel alleen beschikbaar is voor cyberbeveiligingsexperts die het testen, wordt verwacht dat Sora binnenkort publiekelijk wordt gelanceerd. 

Hoewel er al AI-videogeneratoren bestaan ​​en in gebruik zijn, laten de tot nu toe vrijgegeven voorbeelden van door Sora gemaakte video een niveau van fotorealisme zien dat nog niet eerder is gezien. Bovendien is OpenAI uitgegroeid tot een leider op het gebied van AI en de intrede ervan in generatieve video zou grote gevolgen kunnen hebben voor de samenleving, maar ook voor degenen onder ons die belast zijn met het begeleiden van onze studenten door deze dappere nieuwe wereld van computergegenereerde tekst, beelden, en nu films. 

Als docent zie ik veel manieren waarop deze technologie nuttig kan zijn voor mijn leerlingen, naast de mogelijke valkuilen en zorgen. Hoe dit allemaal zal uitpakken valt natuurlijk nog te bezien, maar dit is wat we tot nu toe weten over Sora en de implicaties ervan voor leraren. 

Wat is Sora? 

Sora is een nieuw tekst-naar-video-model van OpenAI dat momenteel door beveiligingsexperts op veiligheid wordt getest voordat het voor het grote publiek beschikbaar wordt gesteld. Vooral docenten zullen moeten onthouden dat ze dit niet mogen verwarren met Overdrive's K12 digitale bibliotheektool van dezelfde naam.

“We leren AI de fysieke wereld in beweging te begrijpen en te simuleren, met als doel modellen te trainen die mensen helpen problemen op te lossen die interactie in de echte wereld vereisen,” OpenAI zei in zijn post waarin Sora werd geïntroduceerd. "Sora kan video's van maximaal een minuut genereren, terwijl de visuele kwaliteit behouden blijft en de aanwijzingen van de gebruiker worden opgevolgd."

Sora wordt mogelijk gemaakt door een combinatie van het diffusiemodel dat wordt gebruikt door OpenAI's Dalle-3-beeldgenerator en elementen van het GPT-4-model, Bekabelde rapporten. De voorbeelden die OpenAI tot nu toe heeft gedeeld, zijn behoorlijk verbluffend. 

In een video, gemaakt met een prompt van één alinea, loopt een vrouw door een regenachtige straat in Tokio, overspoeld met neon. In een ander voorbeeld leidden de prompt ‘historische beelden van Californië tijdens de goudkoorts’ tot een drone-achtige opname van een realistisch ogende westerse stad met paarden en mensen die door de stoffige straten liepen. 

“Sora kan complexe scènes genereren met meerdere karakters, specifieke soorten bewegingen en nauwkeurige details van het onderwerp en de achtergrond”, merkt OpenAI op. “Het model begrijpt niet alleen waar de gebruiker om heeft gevraagd in de prompt, maar ook hoe die dingen in de fysieke wereld bestaan.” 

Wat zijn de beperkingen van Sora?  

Sora is echter verre van perfect. Zoals alle AI-modellen kan het fouten of ‘hallucinaties’ maken die griezeliger en vreemder kunnen zijn, gezien hoe goed ze andere dingen doen. “Het kan moeite hebben met het nauwkeurig simuleren van de fysica van een complexe scène, en begrijpt specifieke gevallen van oorzaak en gevolg mogelijk niet”, merkt OpenAI op. “Het kan bijvoorbeeld zijn dat iemand een hap uit een koekje neemt, maar dat het koekje daarna misschien geen bijtafdruk meer heeft.” 

In een ander voorbeeld dat door OpenAI wordt gedeeld, is een video van een man die op een loopband rent de verkeerde kant op gericht. Dit is duidelijk een vergissing, maar het ziet er best cool uit. De clip doet me denken aan het werk van Maurits Cornelis Escher en is een van de interessantere video's van Sora die OpenAI tot nu toe heeft gedeeld. 

Hoeveel gaat Sora kosten? 

OpenAI heeft geen details over de prijzen vrijgegeven. Maar op basis van andere AI-tools die het heeft uitgebracht, lijkt het onwaarschijnlijk dat volledige toegang gratis zal zijn; dat valt echter nog te bezien. 

Wat zijn enkele implicaties voor docenten?  

Laten we ons eerst op het positieve concentreren: er zijn veel potentiële onderwijstoepassingen voor Sora. 

Als schrijfprofessor kan het leuk zijn om deze tool met studenten te gebruiken. Ik kan dit zien als een boeiende, zij het enigszins gimmickachtige, manier om studenten die fictie schrijven te helpen scènes te visualiseren. Door gerichte aanwijzingen te vereisen, kan het iedereen ook helpen om in duidelijke en nauwkeurige taal te leren schrijven. 

Leraren in andere onderwerpen kunnen ook leuke toepassingen vinden. Ik zou bijvoorbeeld graag zien hoe het de fotosynthese of de beweging van de planeten modelleert. Biedt het een nauwkeurige les in visuele natuurkunde of kunnen uw leerlingen wijzen op de tekortkomingen? 

Nu over zorgen. We weten allemaal dat AI de neiging heeft om te ‘hallucineren’ en de vooroordelen kan versterken van degenen die het op onbedoelde en onvoorspelbare manieren hebben gecreëerd. Dit is zorgwekkend bij op tekst en afbeeldingen gebaseerde AI, maar de inzet wordt nog groter bij video. 

OpenAI lijkt zich zorgen te maken over een aantal van deze problemen en zegt dat het werkt aan het controleren op vooroordelen, en dat het een identificerende tag zal aanbrengen op video's die met de tool zijn gemaakt om desinformatie te bestrijden. Bovendien worden prompts waarin om extreem geweld, seksuele inhoud, haatdragende beelden, gelijkenis met beroemdheden of de intellectuele eigendom van anderen wordt verzocht, afgewezen. 

Maar gezien de uitdagingen van de bestaande AI-technologie is het moeilijk voor te stellen dat een bepaalde mate van vooringenomenheid niet aan deze waarborgen voorbij zou gaan. Google, een van de rivalen van OpenAI, heeft bijvoorbeeld onlangs aangekondigd dat het zijn tool voor het genereren van AI-portretten stopzet na berichten over historische onnauwkeurigheden. waaronder naar verluidt het afbeelden van nazi's als gekleurde mensen

Zelfs als OpenAI door deze voor de hand liggende gevallen van onnauwkeurigheden en vooroordelen kan navigeren, zijn er soorten vooroordelen die inherent onvermijdelijk kunnen zijn. Wat als een leerling Sora vraagt ​​om een ​​mooi persoon te creëren die door de straat loopt – welke standaard van schoonheid zal het model hanteren? 

Net als bij andere AI-tools zou ik docenten adviseren om deze uitdagingen en zorgen te omarmen en alles met hun studenten te bespreken, in plaats van deze uitdagingen en zorgen te negeren. AI is een fascinerende, leuke, krachtige en ook vaak enge nieuwe technologie. Laten we samen met onze studenten leren hoe we er doorheen kunnen navigeren. 

spot_img

Laatste intelligentie

spot_img