ゼファーネットのロゴ

ソラ: ChatGPT のビデオ版について教育者が知っておくべきこと

日付:

ChatGPT でビデオを作成できたらどうなるだろうかと疑問に思ったことがあるなら、もうすぐ答えが得られます。 

Sora は、Microsoft が支援する ChatGPT のメーカーである OpenAI によって最近発表された新しい AI ビデオ生成ツールです。現在、Sora はテスト中のサイバーセキュリティ専門家のみが利用できますが、間もなく一般公開される予定です。 

AI ビデオ ジェネレーターはすでに存在し、使用されていますが、これまでにリリースされた Sora 作成ビデオのサンプルは、これまでに見たことのないレベルのフォトリアリズムを示しています。さらに、OpenAI は AI 分野のリーダーとして台頭しており、その生成ビデオへの参入は、コンピューターで生成されたテキスト、画像、画像などの素晴らしい新しい世界を通して学生を指導する任務を負った私たちだけでなく、社会にも大きな影響を与える可能性があります。そして今、映画。 

教育者として、私はこのテクノロジーが潜在的な落とし穴や懸念に加えて、生徒にとって役立つ多くの点を理解しています。もちろん、これがどのように展開するかはまだわかりませんが、ソラとそれが教師に与える影響についてこれまでにわかっていることは次のとおりです。 

ソラって何ですか? 

Sora は OpenAI の新しいテキストからビデオへのモデルであり、現在、一般に公開される前にセキュリティ専門家によって安全性がテストされています。特に教育者は、これを混同しないように注意する必要があります。 Overdrive の K12 デジタル ライブラリ ツール 同じ名前の

「私たちは、現実世界のインタラクションを必要とする問題を人々が解決するのに役立つモデルをトレーニングすることを目標に、動いている物理世界を理解してシミュレーションできるように AI を教えています。」 OpenAIはSoraを紹介する投稿でこう述べた。 「Sora は、視覚的な品質とユーザーのプロンプトに従いながら、最長 1 分のビデオを生成できます。」

Sora は、OpenAI の Dalle-3 画像生成器で使用される拡散モデルと GPT-4 モデルの要素の組み合わせによって強化されています。 有線レポート。 OpenAI がこれまでに共有した例は、非常に驚​​くべきものです。 

たった 1 段落のプロンプトで作成されたあるビデオでは、雨が降るネオンに満ちた東京の街を女性が歩いています。別の動画では、「ゴールドラッシュ時のカリフォルニアの歴史的な映像」というプロンプトが表示され、馬や人々が埃っぽい通りを歩く現実的な西部の町のドローン スタイルの撮影が行われました。 

「Sora は、複数のキャラクター、特定の種類の動き、被写体と背景の正確な詳細を含む複雑なシーンを生成できます」と OpenAI は述べています。 「モデルは、ユーザーがプロンプトで何を要求したかだけでなく、それらのものが物理世界にどのように存在するのかも理解します。」 

ソラの限界とは何ですか?  

しかし、ソラは完璧とは程遠い。すべての AI モデルと同様に、他のことをどれだけうまくやっているかを考えると、間違いや「幻覚」を起こす可能性があり、それはより不気味で奇妙なものになる可能性があります。 「複雑なシーンの物理を正確にシミュレートするのに苦労する可能性があり、原因と結果の特定のインスタンスを理解できない可能性があります」と OpenAI は指摘しています。 「たとえば、人がクッキーをかじったとしても、その後のクッキーには噛み跡が残らない可能性があります。」 

OpenAI が共有した別の例では、トレッドミルで走っている男性のビデオが間違った方向を向いています。これは明らかに間違いですが、なんだかカッコよく見えます。このクリップはマウリッツ・コルネリス・エッシャーの作品を思い出させ、OpenAI がこれまでに共有した Sora のビデオの中で最も興味深いものの 1 つです。 

ソラの価格はいくらですか? 

OpenAIは価格の詳細を発表していない。しかし、同社がリリースした他の AI ツールに基づくと、完全なアクセスが無料になる可能性は低いようです。ただし、それはまだわかりません。 

教師にとってはどのような影響があるでしょうか?  

まず良い点に焦点を当てましょう。Sora には潜在的な教育アプリケーションが数多くあります。 

文章を書く教授として、このツールを学生に使ってみるのは楽しいかもしれません。これは、小説を書く学生がシーンを視覚化するのに役立つ、少しギミックが多いとはいえ、魅力的な方法であると私は考えています。焦点を絞ったプロンプトを要求することで、誰でも明確で正確な言葉で書くことを学ぶのにも役立ちます。 

他のトピックの教師も楽しい使い方を見つけることができます。たとえば、光合成や惑星の運動をどのようにモデル化するのか見てみたいと思っています。正確な視覚物理学のレッスンを提供できますか? それとも生徒が欠点を指摘できるでしょうか? 

次に懸念事項についてです。 AI には「幻覚を見る」傾向があり、AI を作成した人々の偏見を意図的かつ予測不可能な方法で増幅させる可能性があることは誰もが知っています。これはテキストおよび画像ベースの AI に関して懸念されることですが、ビデオでは危険性がさらに高まります。 

OpenAIはこうした問題の一部を懸念しているようで、偏見のチェックに取り組んでおり、誤った情報と闘うためにこのツールで作成された動画に識別タグを提供する予定だとしている。さらに、極端な暴力、性的コンテンツ、憎悪に満ちた画像、有名人の肖像、または他人の IP を要求するプロンプトは拒否されます。 

しかし、既存の AI テクノロジーの課題を考慮すると、ある程度のバイアスがこれらの安全策をすり抜けないことを想像するのは困難です。たとえば、OpenAIのライバルの1つであるGoogleは、歴史的な不正確さの報告を受けて、AIポートレート生成ツールを一時停止すると最近発表した。 伝えられるところによれば、ナチスを有色人種として描写したものも含まれる

OpenAI がこれらの明らかな不正確さとバイアスを回避できるとしても、本質的に避けられないタイプのバイアスが存在します。学生がソラに、街を歩いている美しい人を描いてほしいと頼んだら、モデルはどのような美しさの基準を使用するでしょうか? 

他の AI ツールと同様に、インストラクターには、これらの課題や懸念を無視するのではなく、それらを受け入れ、生徒とすべてについて話し合うことをお勧めします。 AI は、魅力的で楽しく、強力であると同時に、時には恐ろしい新テクノロジーでもあります。生徒と一緒にそれをナビゲートする方法を学びましょう。 

スポット画像

最新のインテリジェンス

スポット画像