يمكن لـ Sora، وهو نموذج فيديو توليدي جديد مثير للإعجاب تم إنشاؤه بواسطة OpenAI، أن يأخذ وصفًا نصيًا مختصرًا ويحوله إلى مقطع فيلم معقد وعالي الدقة مدته دقيقة.
OpenAI، الشركة الأم لروبوت الدردشة ChatGPT ومولد الصور الثابتة DALL-E، هي من بين العديد من الشركات التي تتنافس على تحسين مولد الفيديو الفوري هذا. وتشمل الشركات الأخرى شركات ناشئة مثل Runway وعمالقة التكنولوجيا مثل Google وMeta Platforms Inc.، المالكين لفيسبوك وInstagram.
تتمتع هذه التكنولوجيا بالقدرة على استبدال الفنانين الرقميين الأقل مهارة تمامًا مع تسريع عمل صانعي الأفلام المتمرسين.
اقرأ أيضا: المؤسس المشارك لشركة OpenAI، أندريه كارباثي، يتنحى عن منصبه ويتطلع إلى المشاريع الشخصية
نقدم لكم Sora، نموذجنا لتحويل النص إلى فيديو.
يمكن لـ Sora إنشاء مقاطع فيديو تصل مدتها إلى 60 ثانية تتميز بمشاهد مفصلة للغاية وحركة الكاميرا المعقدة وشخصيات متعددة ذات مشاعر نابضة بالحياة. https://t.co/7j2JN27M3W
مستعجل: "جميل، ثلجي... pic.twitter.com/ruTEWn87vf
- OpenAI (OpenAI) 15 فبراير 2024
إطلاق سراح سورا
أطلقت شركة OpenAI على نظامها الجديد اسم Sora، وهي الكلمة اليابانية التي تعني السماء. وقد اختار فريق تطوير التكنولوجيا، بما في ذلك الباحثان تيم بروكس وبيل بيبلز، الاسم لأنه "يستحضر فكرة الإمكانات الإبداعية اللامحدودة".
Sora هو أول نموذج لدينا لتوليد الفيديو - يمكنه إنشاء مقاطع فيديو عالية الدقة تصل مدتها إلى دقيقة واحدة. سيكون الذكاء الاصطناعي العام (AGI) قادرًا على محاكاة العالم المادي، ويعتبر سورا خطوة أساسية في هذا الاتجاه. بسعادة غامرة للعمل على هذا مع @بيلبيب at تضمين التغريدة خلال العام الماضي https://t.co/p4kAkRR0i0 pic.twitter.com/Hipku1LFRM
– تيم بروكس (@_tim_brooks) 15 فبراير 2024
وقالوا أيضًا إن الشركة لم تقم بعد بإصدار Sora للجمهور لأنها لا تزال تبحث في المخاطر المرتبطة بالنظام. وبدلا من ذلك، تقوم شركة OpenAI بمشاركة التكنولوجيا مع مجموعة مختارة من الأكاديميين وغيرهم من الباحثين الخارجيين الذين سيعملون على "تشكيل فريق أحمر"، وهو مصطلح لوصف البحث عن إساءة الاستخدام المحتملة.
ووفقا للدكتور بروكس، فإن الهدف هنا هو إعطاء لمحة عما يلوح في الأفق حتى يتمكن الناس من رؤية قدرات هذه التكنولوجيا والحصول على ردود الفعل.
يقوم OpenAI بوضع علامات على مقاطع الفيديو
تقوم OpenAI بالفعل بوضع علامات مائية على مقاطع الفيديو التي أنشأها النظام للإشارة إلى أنها تم إنشاؤها بواسطة الذكاء الاصطناعي (AI). ومع ذلك، تعترف الشركة أنه يمكن إزالتها. وأضافوا أنه قد يكون من الصعب أيضًا تحديدها.
وفقًا OpenAIإنهم يقومون بتدريس الذكاء الاصطناعي (AI) لفهم ومحاكاة العالم المادي المتحرك، بهدف تدريب النماذج التي تساعد الأشخاص على حل المشكلات التي تتطلب تفاعلًا في العالم الحقيقي.
بالإضافة إلى ذلك، فإنهم يمنحون إمكانية الوصول إلى العديد من الفنانين البصريين والمصممين وصانعي الأفلام للحصول على تعليقات حول كيفية تطوير النموذج ليكون أكثر فائدة للمحترفين المبدعين.
هنا هو سورا، نموذج توليد الفيديو الخاص بنا:https://t.co/CDr4DdCrh1
اليوم بدأنا تشكيل فريق أحمر ونوفر إمكانية الوصول إلى عدد محدود من المبدعين.@_tim_brooks @بيلبيب @model_mechanic لا يصدق حقا. عمل مذهل منهم والفريق.
لحظة رائعة.
- سام التمان (sama) 15 فبراير 2024
إنهم يشاركون التقدم الذي أحرزوه في أبحاثهم مبكرًا لبدء العمل مع الأشخاص خارج OpenAI والحصول على تعليقات منهم ولإعطاء الجمهور فكرة عن قدرات الذكاء الاصطناعي التي تلوح في الأفق.
تطوير سورا
ومع ذلك، OpenAI ورفض الكشف عن عدد مقاطع الفيديو التي تعلم النظام منها أو من أين جاءت. وذكروا فقط أن التدريب شمل مقاطع الفيديو المتاحة للجمهور ومقاطع الفيديو المرخصة من قبل أصحاب حقوق الطبع والنشر.
تمت مقاضاة الشركة عدة مرات لاستخدام محتوى محمي بحقوق الطبع والنشر. ومن المحتمل أنها تحاول الحفاظ على تفوقها على المنافسين، لذا فهي لا تكشف عن أي شيء يتعلق بالبيانات المستخدمة لتدريب تقنياتها.
علاوة على ذلك، يتمتع النموذج بفهم عميق للغة، مما يمكنه من تفسير المطالبات بدقة وإنشاء شخصيات مقنعة تنقل المشاعر بشكل واضح. يمكن لـ Sora أيضًا إنشاء عدة لقطات تحافظ على اللقطة المرئية والشخصية داخل مقطع فيديو تم إنشاؤه بشكل فردي.
شاركت OpenAI المطالبة بإنشاء مقطع فيديو على مقبض X الخاص بها، مما تسبب في العديد من ردود الفعل من مستخدمي X.
رسالة سريعة: "امرأة أنيقة تسير في أحد شوارع طوكيو المليئة بالنيون المتوهج الدافئ ولافتات المدينة المتحركة. ترتدي سترة جلدية سوداء، وفستانًا أحمر طويلًا، وحذاءً أسود، وتحمل محفظة سوداء. ترتدي نظارة شمسية وأحمر شفاه أحمر. إنها تمشي بثقة وبشكل عرضي. pic.twitter.com/cjIdgYFaWq
- OpenAI (OpenAI) 15 فبراير 2024
نقاط الضعف في النموذج
وفقًا لـ OpenAI، فإن النموذج الحالي به نقاط ضعف. قد يحتاج إلى مساعدة في محاكاة فيزياء مشهد معقد بدقة وقد يحتاج إلى مساعدة في فهم حالات محددة للسبب والنتيجة. على سبيل المثال، قد يقوم شخص ما بقضم ملف تعريف الارتباط، ولكن بعد ذلك، قد لا يكون هناك علامة عض على ملف تعريف الارتباط.
قد يحتاج النموذج أيضًا إلى توضيح التفاصيل المكانية للموجه، على سبيل المثال، الخلط بين اليسار واليمين، وقد يحتاج إلى مساعدة في الأوصاف الدقيقة للأحداث التي تحدث مع مرور الوقت، مثل متابعة مسار كاميرا محدد.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://metanews.com/openai-presents-ai-that-produces-eye-popping-videos-instantly/