Zephyrnet-logo

Sora: Hva lærere trenger å vite om videoversjonen av ChatGPT

Dato:

Hvis du noen gang har lurt på hva som ville skje hvis ChatGPT kunne lage videoer, er du i ferd med å få svaret ditt. 

Sora er et nytt AI-videogenerasjonsverktøy som nylig ble annonsert av OpenAI, den Microsoft-støttede produsenten av ChatGPT. Selv om det foreløpig bare er tilgjengelig for cybersikkerhetseksperter som tester det, forventes Sora å lanseres offentlig snart. 

Mens AI-videogeneratorer allerede eksisterer og er i bruk, viser prøvene av Sora-skapt video utgitt så langt et nivå av fotorealisme som ikke tidligere er sett. I tillegg har OpenAI dukket opp som en leder innen AI-feltet, og dets inntreden i generativ video kan ha store implikasjoner for samfunnet så vel som for de av oss som har i oppgave å veilede studentene våre gjennom denne modige nye verdenen av datagenerert tekst, bilder, og nå, filmer. 

Som pedagog kan jeg se mange måter denne teknologien kan være nyttig for elevene mine i tillegg til de potensielle fallgruvene og bekymringene. Hvordan dette vil spille ut, gjenstår selvfølgelig å se, men her er hva vi vet om Sora og dets implikasjoner for lærere så langt. 

Hva er Sora? 

Sora er en ny tekst-til-video-modell fra OpenAI som for tiden testes for sikkerhet av sikkerhetseksperter før den gjøres tilgjengelig for allmennheten. Spesielt lærere må huske å ikke forveksle det med Overdrives K12 digitale bibliotekverktøy med samme navn.

"Vi lærer AI å forstå og simulere den fysiske verdenen i bevegelse, med målet om å trene modeller som hjelper folk med å løse problemer som krever interaksjon i den virkelige verden," OpenAI sa i sitt innlegg som introduserte Sora. "Sora kan generere videoer på opptil ett minutt, samtidig som den opprettholder visuell kvalitet og følger brukerens oppfordring."

Sora er drevet av en kombinasjon av diffusjonsmodellen som brukes av OpenAIs Dalle-3 bildegenerator, samt elementer av GPT-4-modellen, Kablet rapporter. Eksemplene OpenAI har delt så langt, er ganske fantastiske. 

I en video laget av en melding på ett avsnitt, går en kvinne nedover en regnvåt Tokyo-gate oversvømmet av neon. I en annen førte de umiddelbare «historiske opptakene av California under gullfeberen» til et drone-stilbilde av en realistisk vestlig by med hester og mennesker som gikk i de støvete gatene. 

"Sora er i stand til å generere komplekse scener med flere karakterer, spesifikke typer bevegelser og nøyaktige detaljer om motivet og bakgrunnen," bemerker OpenAI. "Modellen forstår ikke bare hva brukeren har bedt om i forespørselen, men også hvordan disse tingene eksisterer i den fysiske verden." 

Hva er Soras begrensninger?  

Sora er imidlertid langt fra perfekt. Som alle AI-modeller kan den gjøre feil eller "hallusinasjoner" som kan være mer uhyggelige og merkelige gitt hvor godt de gjør andre ting. "Det kan slite med å nøyaktig simulere fysikken til en kompleks scene, og kan ikke forstå spesifikke tilfeller av årsak og virkning," bemerker OpenAI. "For eksempel kan en person ta en bit av en informasjonskapsel, men etterpå kan det hende at informasjonskapselen ikke har et bitemerke." 

I et annet eksempel delt av OpenAI, vender en video av en mann som løper på en tredemølle feil vei. Dette er åpenbart en feil, men det ser litt kult ut. Klippet minner meg om Maurits Cornelis Eschers arbeid og er en av de mer interessante videoene fra Sora som OpenAI har delt så langt. 

Hvor mye vil Sora koste? 

OpenAI har ikke gitt ut noen detaljer om priser. Men basert på andre AI-verktøy den har utgitt, virker det usannsynlig at full tilgang vil være gratis; det gjenstår imidlertid å se. 

Hva er noen implikasjoner for lærere?  

La oss fokusere på det positive først: Det er mange potensielle undervisningsapplikasjoner for Sora. 

Som skriveprofessor kunne det vært morsomt å bruke dette verktøyet sammen med studenter. Jeg kan se dette som en engasjerende, om enn litt gimmick, måte å hjelpe skjønnlitterære elever med å visualisere scener. Ved å kreve fokuserte spørsmål kan det også hjelpe alle å lære å skrive med klart og presist språk. 

Lærere i andre emner kan også finne morsomme bruksområder. For eksempel vil jeg gjerne se hvordan det modellerer fotosyntese eller bevegelsen til planetene. Gir det en nøyaktig visuell fysikkleksjon, eller kan elevene påpeke feilene? 

Nå om bekymringer. Vi vet alle at AI har en tendens til å "hallusinere" og kan forsterke skjevheten til de som skapte den på utilsiktede og uforutsigbare måter. Dette er bekymrende med tekst- og bildebasert AI, men innsatsen økes ytterligere med video. 

OpenAI virker bekymret for noen av disse problemene og sier at de jobber med å se etter skjevheter, og vil gi en identifiserende tag på videoer laget med verktøyet for å bekjempe feilinformasjon. I tillegg vil forespørsler som ber om ekstrem vold, seksuelt innhold, hatefulle bilder, kjendisliknelser eller andres IP bli avvist. 

Men gitt utfordringene med eksisterende AI-teknologi, er det vanskelig å forestille seg en viss grad av skjevhet som ikke glipper av disse sikkerhetstiltakene. Google, en av OpenAIs rivaler, kunngjorde for eksempel nylig at den stopper sitt AI-portrettgenererende verktøy etter rapporter om historiske unøyaktigheter, inkludert angivelig å fremstille nazister som farger

Selv om OpenAI kan navigere i disse åpenbare tilfellene av unøyaktigheter og skjevheter, er det typer skjevheter som i seg selv kan være uunngåelige. Hva om en student ber Sora om å skape en vakker person som går nedover en gate - hvilken skjønnhetsstandard vil modellen bruke? 

Som med andre AI-verktøy, i stedet for å ignorere disse utfordringene og bekymringene, vil jeg råde instruktører til å omfavne dem og diskutere det hele med elevene sine. AI er en fascinerende, morsom, kraftig og også ofte skummel ny teknologi. La oss lære hvordan du navigerer i det sammen med elevene våre. 

spot_img

Siste etterretning

spot_img