شعار زيفيرنت

يؤدي هذا الذكاء الاصطناعي إلى معالجة فيديو سلسة بدون تعلم عميق أو مجموعات بيانات

التاريخ:

هل سبق لك أن أردت تحرير مقطع فيديو لإزالة أو إضافة شخص ما ، أو تغيير الخلفية ، أو جعله يدوم لفترة أطول قليلاً ، أو تغيير الدقة لتناسب نسبة عرض إلى ارتفاع معينة دون ضغطها أو تمديدها؟ بالنسبة لأولئك الذين قاموا بالفعل بتشغيل حملات إعلانية ، فأنت بالتأكيد تريد الحصول على أشكال مختلفة من مقاطع الفيديو الخاصة بك لاختبار AB ومعرفة ما هو الأفضل. حسنًا ، هذا البحث الجديد بواسطة Niv Haim et al. يمكن أن تساعدك في القيام بكل ما يتعلق بفيديو واحد وبدقة عالية! في الواقع ، باستخدام فيديو بسيط ، يمكنك أداء أي مهام ذكرتها للتو في ثوانٍ أو بضع دقائق لمقاطع الفيديو عالية الجودة. يمكنك استخدامه بشكل أساسي لأي معالجة فيديو أو تطبيق إنشاء فيديو تفكر فيه. حتى أنه يتفوق على شبكات GAN من جميع النواحي ولا يستخدم أي بحث خيالي للتعلم العميق ولا يتطلب مجموعة بيانات ضخمة وغير عملية! وأفضل شيء هو أن هذه التقنية قابلة للتطوير لمقاطع الفيديو عالية الدقة

صورة

صورة الملف الشخصي لـ Louis Bouchard Hacker Noon

لويس بوشار

أشرح مصطلحات وأخبار الذكاء الاصطناعي لغير الخبراء.

هل سبق لك أن أردت تعديل مقطع فيديو لإزالة أو إضافة شخص ما ، أو تغيير الخلفية ، أو جعله يدوم لفترة أطول قليلاً ، أو تغيير الدقة لتناسب نسبة عرض إلى ارتفاع معينة دون ضغطها أو تمديدها؟ بالنسبة لأولئك الذين قاموا بالفعل بتشغيل حملات إعلانية ، فأنت بالتأكيد تريد الحصول على أشكال مختلفة من مقاطع الفيديو الخاصة بك لاختبار AB ومعرفة ما هو الأفضل.

حسنًا ، هذا البحث الجديد بواسطة Niv Haim et al. يمكن أن تساعدك في القيام بكل ما يتعلق بفيديو واحد وبدقة عالية!

في الواقع ، باستخدام فيديو بسيط ، يمكنك أداء أي مهام ذكرتها للتو في ثوانٍ أو بضع دقائق لمقاطع الفيديو عالية الجودة. يمكنك استخدامه بشكل أساسي لأي معالجة فيديو أو تطبيق إنشاء فيديو تفكر فيه. حتى أنه يتفوق على شبكات GAN من جميع النواحي ولا يستخدم أي بحث خيالي للتعلم العميق ولا يتطلب مجموعة بيانات ضخمة وغير عملية!

وأفضل شيء هو أن هذه التقنية قابلة للتطوير لمقاطع الفيديو عالية الدقة ...

شاهد الفيديو

مراجع حسابات

اقرأ المقال كاملاً: https://www.louisbouchard.ai/vgpnn-ge…
► تمت تغطية الورقة: Haim، N.، Feinstein، B.، Granot، N.، Shocher، A.، Bagon، S.، Dekel، T.، & Irani، M. (2021). جيل متنوع من فيديو واحد أصبح ممكنًا. ArXiv ، ABS / 2109.08591.
التقنية التي تم تكييفها من الصور إلى مقاطع الفيديو: نيف جرانوت ، بن فينشتاين ، أساف شوشير ، شاي باجون ، وميشال إيراني. Drop the gan: دفاعًا عن التصحيحات ، أقرب الجيران كنماذج إنتاجية لصورة واحدة. الإصدار التمهيدي لـ arXiv arXiv: 2103.15545 ، 2021.
► الرمز (متاح قريبًا): https://nivha.github.io/vgpnn/
رسالتي الإخبارية (يتم شرح تطبيق AI جديد أسبوعيًا لرسائل البريد الإلكتروني الخاصة بك!) https://www.louisbouchard.ai/newsletter/

نسخة فيديو

00:00

هل سبق لك أن أردت تحرير مقطع فيديو

00:02

إزالة أو إضافة شخص تغيير

00:04

الخلفية تجعلها تدوم لفترة أطول قليلاً أو

00:06

تغيير الدقة لتناسب ملفًا محددًا

00:08

نسبة العرض إلى الارتفاع بدون ضغط أو

00:10

تمتد إلى أولئك الذين منكم

00:12

نفذت بالفعل حملات إعلانية لك

00:14

أراد بالتأكيد أن يكون لديه اختلافات

00:16

أشرطة الفيديو الخاصة بك لاختبار أب ونرى ماذا

00:19

يعمل بشكل أفضل هذا البحث الجديد من قبل niv

00:22

يمكن أن يساعدك haim ital في القيام بكل هذه الأشياء

00:24

من مقطع فيديو واحد وبجودة عالية

00:27

تعريف بالفعل باستخدام فيديو بسيط

00:29

يمكنك أداء أي مهام أنا فقط

00:32

المذكورة في ثوان أو بضع دقائق

00:34

للحصول على مقاطع فيديو عالية الجودة يمكنك ذلك

00:36

استخدمه بشكل أساسي لأي فيديو

00:38

التلاعب أو توليد الفيديو

00:40

التطبيق الذي تفكر فيه حتى

00:42

يتفوق على البنادق بأي طريقة ولا

00:45

استخدام أي بحث خيالي التعلم العميق ولا

00:48

يتطلب مجموعة بيانات ضخمة وغير عملية

00:51

وأفضل شيء أن هذا

00:52

تقنية قابلة للتحجيم إلى دقة عالية

00:55

أشرطة الفيديو ليست فقط للبحث

00:57

أغراض مع مقاطع فيديو 256 × 256 بكسل أوه

01:01

وبالطبع يمكنك استخدامه مع الصور

01:04

دعونا نرى كيف يعمل النموذج

01:06

يسمى التصحيح التوليدي القائم على الفيديو

01:08

أقرب الجيران vgpnn بدلاً من استخدام

01:11

الخوارزميات والنماذج المعقدة مثل gans

01:14

أو محولات الباحثين

01:16

vgpn المتقدمة تختار أبسط بكثير

01:19

اقترب ولكن أعيد النظر في الأقرب

01:22

خوارزمية الجار أولًا قاموا بتقليص الحجم

01:24

الصورة بطريقة هرمية حيث كل

01:26

المستوى هو دقة زهرة من

01:28

واحد أعلاه ثم يضيفون ضوضاء عشوائية إلى

01:31

المستوى الأكثر خشونة لتوليد

01:33

صورة مختلفة مشابهة لما تفعله البنادق

01:36

في المساحة المضغوطة بعد الترميز

01:38

لاحظ الصورة التي سأقولها هنا

01:40

صورة للبساطة ولكن في هذه الحالة

01:42

نظرًا لأنه يتم تطبيقه على مقاطع الفيديو ، فإن العملية

01:45

على ثلاثة إطارات في وقت واحد

01:48

مضيفا بعدا زمنيا ولكن

01:49

يبقى الشرح كما هو مع إضافة

01:52

خطوة في نهاية الصورة في

01:54

مقياس خشن مع الضوضاء المضافة هو

01:56

مقسمة إلى عدة مربعات صغيرة

01:59

يصحح جميع البقع الموجودة في الصورة بامتداد

02:01

يتم استبدال الضوضاء المضافة بأكثر

02:04

تصحيح مماثل من التحجيم الأولي

02:06

أسفل الصورة دون ضوضاء هذا أكثر

02:09

يتم قياس رقعة مماثلة مع

02:11

أقرب خوارزمية الجار كما نشاء

02:13

رؤية معظم هذه البقع ستبقى

02:15

نفس الشيء ولكن اعتمادًا على الضوضاء المضافة

02:17

ستتغير بعض التصحيحات بما يكفي لـ

02:19

تجعلهم يبدون أكثر شبهاً بآخر

02:21

التصحيح في الصورة الأولية هذا هو

02:24

الناتج فبن ترى هنا هذه التغييرات

02:27

تكفي فقط لإنشاء ملف

02:29

نسخة من الصورة ثم هذا أولا

02:31

يتم رفع مستوى الإخراج واستخدامه للمقارنة

02:34

مع صورة الإدخال للمقياس التالي

02:36

ليكون بمثابة نسخة صاخبة منه و

02:38

تتكرر نفس الخطوات في هذا التالي

02:41

التكرار نقسم هذه الصور إلى

02:43

بقع صغيرة واستبدال سابقا

02:45

التي تم إنشاؤها مع الأكثر تشابهًا

02:48

تلك الموجودة في الخطوة الحالية ، دعنا ندخل

02:50

وحدة vpn هذه التي قمنا بتغطيتها مثلك

02:53

يمكن أن ترى هنا الاختلاف الوحيد من

02:55

الخطوة الأولى مع الضوضاء المضافة هي

02:58

التي نقارن بين الراقي المتولد

03:00

الصورة هنا تدل على أنها q مع ترقية

03:03

نسخة من الصورة السابقة فقط هكذا

03:06

له نفس مستوى التفاصيل المشار إليه كـ

03:09

ك بشكل أساسي باستخدام المستوى أدناه كـ

03:12

مقارنات نقارن q و k ثم

03:15

حدد التصحيحات المقابلة في ملف

03:17

صورة من هذا المستوى الحالي v إلى

03:20

إنشاء الصورة الجديدة لهذه الخطوة

03:22

والتي سيتم استخدامها في اليوم التالي

03:24

التكرار كما ترى هنا مع الصغير

03:26

الأسهم k هي مجرد نسخة راقية من

03:28

الصورة التي أنشأناها تصغير الحجم في

03:31

الخطوة الأولى من هذه الخوارزمية حيث

03:33

أنشأنا التدرج الهرمي

03:35

إصدارات من صورتنا هذا يتم القيام به

03:38

قارن نفس مستوى الحدة في

03:40

كلا الصورتين الراقيين ولدت

03:42

الصورة من الطبقة السابقة q ستكون

03:45

ضبابية أكثر بكثير من الصورة الموجودة في

03:48

الخطوة الحالية v وستكون صعبة للغاية

03:50

للعثور على تصحيحات مماثلة ، يتكرر هذا

03:53

حتى نعود إلى أعلى

03:54

هرم مع نتائج عالية الدقة

03:57

ثم كل هذه البقع التي تم إنشاؤها

03:59

مطوية في فيديو وفويلا يمكنك ذلك

04:02

كرر هذا مع أصوات مختلفة أو

04:04

تعديلات لتوليد أي اختلافات

04:06

التي تريدها على مقاطع الفيديو الخاصة بك ، لنفعل ذلك سريعًا

04:09

تلخيص تم تصغير الصورة إلى

04:11

تضاف ضوضاء المقاييس المتعددة إلى

04:13

صورة بمقياس كورسا والتي تنقسم إلى ملفات

04:16

بقع مربعة صغيرة كل رقعة صاخبة

04:18

ثم استبدل بأكثرها تشابهًا

04:20

بقع من نفس الصورة المضغوطة

04:23

بدون ضوضاء تسبب تغييرات عشوائية قليلة

04:26

في الصورة مع الحفاظ على الواقعية على حد سواء

04:28

الصورة والصورة التي تم إنشاؤها حديثًا

04:31

بدون ضوضاء من هذه الخطوة

04:33

ومقارنتها بالعثور على الأكثر تشابهًا

04:36

بقع مع أقرب جار مرة أخرى

04:38

هذه البقع المتشابهة ثم

04:40

المختار من الصورة الحالية

04:42

الدقة لإنشاء صورة جديدة لـ

04:45

الخطوة مرة أخرى ونكرر هذا

04:47

الارتقاء ومقارنة الخطوات حتى نقوم

04:49

نعود إلى قمة الهرم مع

04:52

نتائج عالية الدقة بالطبع

04:54

النتائج ليست مثالية لا يزال بإمكانك

04:56

رؤية بعض القطع الأثرية مثل ظهور الأشخاص

04:58

وتختفي في أماكن غريبة أو

05:00

ببساطة نسخ ولصق شخص ما في بعض

05:02

مما يجعل الأمر واضحًا جدًا إذا كنت

05:05

التركيز عليه لا يزال هو الأول فقط

05:07

ورقة تهاجم عمليات التلاعب بالفيديو باستخدام ملفات

05:09

أقرب خوارزمية الجار و

05:11

مما يجعلها قابلة للتطوير إلى دقة عالية

05:13

من الرائع دائمًا مشاهدة مقاطع الفيديو

05:15

أساليب مختلفة أنا متحمس للغاية

05:18

لرؤية الورقة التالية تتحسن

05:20

هذا أيضا النتائج لا تزال

05:22

رائعة للغاية ويمكن استخدامها

05:24

كأداة لزيادة البيانات للنماذج

05:26

العمل على مقاطع الفيديو بسبب انخفاضها الشديد

05:29

وقت التشغيل مما يسمح للنماذج الأخرى بالتدريب

05:31

على مجموعات بيانات أكبر وأكثر تنوعًا

05:33

بدون تكلفة كبيرة إذا كنت مهتمًا

05:35

في تعلم المزيد عن هذه التقنية ط

05:37

سيوصي بشدة بقراءة ملفات

05:38

الورق هو الرابط الأول في ملف

05:40

وصف شكرا على المشاهدة و

05:42

لكل شخص يدعم عملي

05:44

patreon أو عن طريق التعليق والإعجاب

05:46

أشرطة الفيديو هنا على يوتيوب

05:54

لصحتك!

الإنجليزية (تم إنشاؤه تلقائيًا)

الكل

تم تحميله مؤخرًا

شاهد

الاوسمة (تاج)

انضم إلى Hacker Noon

قم بإنشاء حسابك المجاني لفتح تجربة القراءة المخصصة الخاصة بك.

أفلاطون. Web3 مُعاد تصوره. تضخيم ذكاء البيانات.
انقر هنا للوصول.

المصدر: https://hackernoon.com/this-ai-performs-seamless-video-manipulation-without-deep-learning-or-datasets؟source=rss

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة