شعار زيفيرنت

تنتج Sora AI مقاطع فيديو ملفتة للنظر على الفور

التاريخ:

يمكن لـ Sora، وهو نموذج فيديو توليدي جديد مثير للإعجاب تم إنشاؤه بواسطة OpenAI، أن يأخذ وصفًا نصيًا مختصرًا ويحوله إلى مقطع فيلم معقد وعالي الدقة مدته دقيقة.

OpenAI، الشركة الأم لروبوت الدردشة ChatGPT ومولد الصور الثابتة DALL-E، هي من بين العديد من الشركات التي تتنافس على تحسين مولد الفيديو الفوري هذا. وتشمل الشركات الأخرى شركات ناشئة مثل Runway وعمالقة التكنولوجيا مثل Google وMeta Platforms Inc.، المالكين لفيسبوك وInstagram.

تتمتع هذه التكنولوجيا بالقدرة على استبدال الفنانين الرقميين الأقل مهارة تمامًا مع تسريع عمل صانعي الأفلام المتمرسين.

اقرأ أيضا: المؤسس المشارك لشركة OpenAI، أندريه كارباثي، يتنحى عن منصبه ويتطلع إلى المشاريع الشخصية

إطلاق سراح سورا

أطلقت شركة OpenAI على نظامها الجديد اسم Sora، وهي الكلمة اليابانية التي تعني السماء. وقد اختار فريق تطوير التكنولوجيا، بما في ذلك الباحثان تيم بروكس وبيل بيبلز، الاسم لأنه "يستحضر فكرة الإمكانات الإبداعية اللامحدودة".

وقالوا أيضًا إن الشركة لم تقم بعد بإصدار Sora للجمهور لأنها لا تزال تبحث في المخاطر المرتبطة بالنظام. وبدلا من ذلك، تقوم شركة OpenAI بمشاركة التكنولوجيا مع مجموعة مختارة من الأكاديميين وغيرهم من الباحثين الخارجيين الذين سيعملون على "تشكيل فريق أحمر"، وهو مصطلح لوصف البحث عن إساءة الاستخدام المحتملة.

ووفقا للدكتور بروكس، فإن الهدف هنا هو إعطاء لمحة عما يلوح في الأفق حتى يتمكن الناس من رؤية قدرات هذه التكنولوجيا والحصول على ردود الفعل.

يقوم OpenAI بوضع علامات على مقاطع الفيديو

تقوم OpenAI بالفعل بوضع علامات مائية على مقاطع الفيديو التي أنشأها النظام للإشارة إلى أنها تم إنشاؤها بواسطة الذكاء الاصطناعي (AI). ومع ذلك، تعترف الشركة أنه يمكن إزالتها. وأضافوا أنه قد يكون من الصعب أيضًا تحديدها.

وفقًا OpenAIإنهم يقومون بتدريس الذكاء الاصطناعي (AI) لفهم ومحاكاة العالم المادي المتحرك، بهدف تدريب النماذج التي تساعد الأشخاص على حل المشكلات التي تتطلب تفاعلًا في العالم الحقيقي.

بالإضافة إلى ذلك، فإنهم يمنحون إمكانية الوصول إلى العديد من الفنانين البصريين والمصممين وصانعي الأفلام للحصول على تعليقات حول كيفية تطوير النموذج ليكون أكثر فائدة للمحترفين المبدعين.

إنهم يشاركون التقدم الذي أحرزوه في أبحاثهم مبكرًا لبدء العمل مع الأشخاص خارج OpenAI والحصول على تعليقات منهم ولإعطاء الجمهور فكرة عن قدرات الذكاء الاصطناعي التي تلوح في الأفق.

تطوير سورا

ومع ذلك، OpenAI ورفض الكشف عن عدد مقاطع الفيديو التي تعلم النظام منها أو من أين جاءت. وذكروا فقط أن التدريب شمل مقاطع الفيديو المتاحة للجمهور ومقاطع الفيديو المرخصة من قبل أصحاب حقوق الطبع والنشر.

تمت مقاضاة الشركة عدة مرات لاستخدام محتوى محمي بحقوق الطبع والنشر. ومن المحتمل أنها تحاول الحفاظ على تفوقها على المنافسين، لذا فهي لا تكشف عن أي شيء يتعلق بالبيانات المستخدمة لتدريب تقنياتها.

علاوة على ذلك، يتمتع النموذج بفهم عميق للغة، مما يمكنه من تفسير المطالبات بدقة وإنشاء شخصيات مقنعة تنقل المشاعر بشكل واضح. يمكن لـ Sora أيضًا إنشاء عدة لقطات تحافظ على اللقطة المرئية والشخصية داخل مقطع فيديو تم إنشاؤه بشكل فردي.

شاركت OpenAI المطالبة بإنشاء مقطع فيديو على مقبض X الخاص بها، مما تسبب في العديد من ردود الفعل من مستخدمي X.

نقاط الضعف في النموذج

وفقًا لـ OpenAI، فإن النموذج الحالي به نقاط ضعف. قد يحتاج إلى مساعدة في محاكاة فيزياء مشهد معقد بدقة وقد يحتاج إلى مساعدة في فهم حالات محددة للسبب والنتيجة. على سبيل المثال، قد يقوم شخص ما بقضم ملف تعريف الارتباط، ولكن بعد ذلك، قد لا يكون هناك علامة عض على ملف تعريف الارتباط.

قد يحتاج النموذج أيضًا إلى توضيح التفاصيل المكانية للموجه، على سبيل المثال، الخلط بين اليسار واليمين، وقد يحتاج إلى مساعدة في الأوصاف الدقيقة للأحداث التي تحدث مع مرور الوقت، مثل متابعة مسار كاميرا محدد.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة