जेफिरनेट लोगो

यह एआई डीप लर्निंग या डेटासेट के बिना निर्बाध वीडियो मैनिपुलेशन करता है

दिनांक:

क्या आप कभी किसी को हटाने या जोड़ने के लिए किसी वीडियो को संपादित करना चाहते हैं, पृष्ठभूमि बदलना चाहते हैं, इसे थोड़ी देर तक चलाना चाहते हैं, या किसी विशिष्ट पहलू अनुपात को बिना संपीड़ित या खींचे फिट करने के लिए रिज़ॉल्यूशन बदलना चाहते हैं? आप में से जो पहले से ही विज्ञापन अभियान चला चुके हैं, आप निश्चित रूप से एबी परीक्षण के लिए अपने वीडियो की विविधताएं चाहते हैं और देखें कि सबसे अच्छा क्या काम करता है। खैर, निव हैम एट अल द्वारा यह नया शोध। एक ही वीडियो में और एचडी में सब कुछ करने में आपकी मदद कर सकता है! दरअसल, एक साधारण वीडियो का उपयोग करके, आप उच्च गुणवत्ता वाले वीडियो के लिए मेरे द्वारा बताए गए किसी भी कार्य को सेकंड या कुछ मिनटों में कर सकते हैं। आप मूल रूप से इसका उपयोग किसी भी वीडियो हेरफेर या वीडियो जनरेशन एप्लिकेशन के लिए कर सकते हैं जो आपके मन में है। यह सभी तरह से GAN से बेहतर प्रदर्शन करता है और किसी गहन शिक्षण फैंसी शोध का उपयोग नहीं करता है और न ही एक विशाल और अव्यवहारिक डेटासेट की आवश्यकता है! और सबसे अच्छी बात यह है कि यह तकनीक उच्च-रिज़ॉल्यूशन वीडियो के लिए मापनीय है

की छवि

लुई बुचर्ड हैकर दोपहर प्रोफाइल तस्वीर

लुई बुचार्ड

मैं गैर-विशेषज्ञों को कृत्रिम बुद्धिमत्ता के नियम और समाचार समझाता हूं।

क्या आप कभी किसी को हटाने या जोड़ने के लिए किसी वीडियो को संपादित करना चाहते हैं, पृष्ठभूमि बदलना चाहते हैं, इसे थोड़ी देर तक चलाना चाहते हैं, या किसी विशिष्ट पहलू अनुपात को बिना संपीड़ित या खींचे फिट करने के लिए रिज़ॉल्यूशन बदलना चाहते हैं? आप में से जो पहले से ही विज्ञापन अभियान चला चुके हैं, आप निश्चित रूप से एबी परीक्षण के लिए अपने वीडियो की विविधताएं चाहते हैं और देखें कि सबसे अच्छा क्या काम करता है।

खैर, निव हैम एट अल द्वारा यह नया शोध। एक ही वीडियो में और एचडी में आप सभी के बारे में करने में मदद कर सकते हैं!

दरअसल, एक साधारण वीडियो का उपयोग करके, आप उच्च गुणवत्ता वाले वीडियो के लिए मेरे द्वारा बताए गए किसी भी कार्य को सेकंड या कुछ मिनटों में कर सकते हैं। आप मूल रूप से इसका उपयोग किसी भी वीडियो हेरफेर या वीडियो जनरेशन एप्लिकेशन के लिए कर सकते हैं जो आपके मन में है। यह सभी तरह से GAN से बेहतर प्रदर्शन करता है और किसी भी गहन शिक्षण फैंसी शोध का उपयोग नहीं करता है और न ही एक विशाल और अव्यवहारिक डेटासेट की आवश्यकता होती है!

और सबसे अच्छी बात यह है कि यह तकनीक उच्च-रिज़ॉल्यूशन वीडियो के लिए मापनीय है…

वीडियो देखना

संदर्भ

पूरा लेख पढ़ें: https://www.louisbouchard.ai/vgpnn-ge…
पेपर कवर: हैम, एन।, फेनस्टीन, बी।, ग्रानोट, एन।, शोचर, ए।, बैगन, एस।, डेकेल, टी।, और ईरानी, ​​​​एम। (२०२१)। एकल वीडियो से विविध पीढ़ी संभव हुई। आर्क्सिव, एब्स/2021।
वह तकनीक जिसे छवियों से वीडियो में रूपांतरित किया गया था: Niv Granot, Ben Feinstein, Assaf Shocher, Shai Bagon, और Michal Irani। गन ड्रॉप करें: पैच के बचाव में निकटतम पड़ोसियों को सिंगल इमेज जनरेटिव मॉडल के रूप में। arXiv प्रीप्रिंट arXiv:2103.15545, 2021।
कोड (जल्द ही उपलब्ध): https://nivha.github.io/vgpnn/
►माई न्यूज़लेटर (आपके ईमेल पर साप्ताहिक रूप से समझाया गया एक नया AI एप्लिकेशन!): https://www.louisbouchard.ai/newsletter/

वीडियो ट्रांसक्रिप्ट

00:00

क्या आप कभी एक वीडियो संपादित करना चाहते हैं

00:02

किसी को हटाओ या जोड़ो बदलो

00:04

पृष्ठभूमि इसे थोड़ी देर तक चलने दें या

00:06

एक विशिष्ट फिट करने के लिए संकल्प बदलें

00:08

पक्ष अनुपात को संपीड़ित किए बिना या

00:10

आप में से उन लोगों के लिए इसे खींच रहे हैं जो

00:12

आप पहले से ही विज्ञापन अभियान चला चुके हैं

00:14

निश्चित रूप से की विविधताएं रखना चाहता था

00:16

ab परीक्षण के लिए आपके वीडियो और देखें क्या

00:19

एनआईवी द्वारा यह नया शोध सबसे अच्छा काम करता है

00:22

हैम इटाल ये सब करने में आपकी मदद कर सकता है

00:24

एक वीडियो से बाहर और उच्च में

00:27

परिभाषा वास्तव में एक साधारण वीडियो का उपयोग कर

00:29

आप मेरे द्वारा किए गए किसी भी कार्य को कर सकते हैं

00:32

सेकंड में या कुछ ही मिनटों में उल्लेख किया गया

00:34

उच्च गुणवत्ता वाले वीडियो के लिए आप कर सकते हैं

00:36

मूल रूप से इसे किसी भी वीडियो के लिए उपयोग करें

00:38

हेरफेर या वीडियो पीढ़ी

00:40

आवेदन आप इसे ध्यान में भी है

00:42

किसी भी तरह से बंदूकों से बेहतर प्रदर्शन करता है और नहीं करता है

00:45

किसी भी गहन शिक्षण फैंसी शोध का उपयोग करें और न ही

00:48

एक विशाल और अव्यवहारिक डेटा सेट की आवश्यकता है

00:51

और सबसे अच्छी बात यह है कि यह

00:52

तकनीक उच्च संकल्प के लिए मापनीय है

00:55

वीडियो यह केवल शोध के लिए नहीं है

00:57

उद्देश्य 256 गुणा 256 पिक्सेल वीडियो ओह

01:01

और निश्चित रूप से आप इसे छवियों के साथ उपयोग कर सकते हैं

01:04

आइए देखें कि यह कैसे काम करता है मॉडल है

01:06

वीडियो आधारित जनरेटिव पैच कहा जाता है

01:08

उपयोग करने के बजाय निकटतम पड़ोसी vgpnn

01:11

जटिल एल्गोरिदम और मॉडल जैसे गन्स

01:14

या ट्रांसफॉर्मर शोधकर्ताओं कि

01:16

विकसित वीजीपीएन एक बहुत आसान विकल्प चुनते हैं

01:19

दृष्टिकोण लेकिन निकटतम का पुनरीक्षण

01:22

पड़ोसी एल्गोरिथ्म पहले वे डाउनस्केल करते हैं

01:24

एक पिरामिड तरीके से छवि जहां प्रत्येक

01:26

स्तर की तुलना में एक फूल संकल्प है

01:28

एक ऊपर तो वे यादृच्छिक शोर जोड़ते हैं

01:31

a . उत्पन्न करने के लिए सबसे मोटे स्तर

01:33

बंदूकें क्या करती हैं के समान अलग छवि

01:36

एन्कोडिंग के बाद संपीड़ित जगह में

01:38

छवि ध्यान दें कि यहाँ मैं कहूंगा

01:40

सादगी के लिए छवि लेकिन इस मामले में

01:42

चूंकि यह वीडियो प्रक्रिया पर लागू होता है

01:45

एक साथ तीन फ्रेम पर बना है

01:48

एक समय आयाम जोड़ना लेकिन

01:49

स्पष्टीकरण एक अतिरिक्त के साथ समान रहता है

01:52

छवि के अंत में कदम रखें

01:54

जोड़ा गया शोर के साथ सबसे बड़ा पैमाना है

01:56

कई छोटे वर्ग में विभाजित

01:59

छवि में सभी पैच को पैच करता है

02:01

जोड़ा गया शोर सबसे अधिक के साथ बदल दिया गया है

02:04

प्रारंभिक स्केल से समान पैच

02:06

बिना शोर के नीचे की छवि यह सबसे अधिक

02:09

इसी तरह के पैच के साथ मापा जाता है

02:11

निकटतम पड़ोसी एल्गोरिथ्म जैसा कि हम करेंगे

02:13

देखें इनमें से अधिकतर पैच बने रहेंगे

02:15

वही लेकिन अतिरिक्त शोर के आधार पर

02:17

कुछ पैच बस इतना बदल देंगे

02:19

उन्हें दूसरे के समान दिखने दें

02:21

प्रारंभिक छवि में पैच यह है

02:24

वीपीएन आउटपुट आप यहां देख सकते हैं ये बदलाव

02:27

एक नया उत्पन्न करने के लिए पर्याप्त हैं

02:29

छवि का संस्करण तो यह पहले

02:31

आउटपुट बढ़ा हुआ है और तुलना करने के लिए उपयोग किया जाता है

02:34

अगले पैमाने की इनपुट छवि के साथ

02:36

इसके शोर संस्करण के रूप में कार्य करने के लिए और

02:38

इस अगले में वही चरण दोहराए गए हैं

02:41

पुनरावृत्ति हम इन छवियों को विभाजित करते हैं

02:43

छोटे पैच और पहले की जगह

02:45

सबसे समान के साथ उत्पन्न

02:48

वर्तमान चरण में आइए हम इसमें शामिल हों

02:50

यह वीपीएन मॉड्यूल हमने अभी आपके जैसा कवर किया है

02:53

यहाँ से केवल अंतर देख सकते हैं

02:55

जोड़ा गया शोर के साथ प्रारंभिक चरण है

02:58

कि हम उत्पन्न upscale की तुलना करते हैं

03:00

यहाँ छवि को एक upscaled . के साथ q के रूप में दर्शाया गया है

03:03

पिछली छवि का संस्करण बस इतना ही

03:06

विवरण के समान स्तर को दर्शाया गया है

03:09

k मूल रूप से नीचे के स्तर का उपयोग कर रहा है

03:12

तुलना हम q और k की तुलना करते हैं और फिर

03:15

में संबंधित पैच का चयन करें

03:17

इस वर्तमान स्तर से छवि v to

03:20

इस चरण के लिए नई छवि उत्पन्न करें

03:22

जिसका उपयोग अगले के लिए किया जाएगा

03:24

पुनरावृत्ति जैसा कि आप यहाँ छोटे के साथ देखते हैं

03:26

तीर k . का सिर्फ एक अपस्केल संस्करण है

03:28

हमने जो छवि बनाई है, उसे कम करके v in . बनाया गया है

03:31

इस एल्गोरिथम का प्रारंभिक चरण जहां

03:33

हमने पिरामिड स्केलिंग बनाई

03:35

हमारी छवि के संस्करण यह करने के लिए किया जाता है

03:38

तीखेपन के समान स्तर की तुलना करें

03:40

दोनों छवियों को upscale के रूप में उत्पन्न किया गया

03:42

पिछली परत से छवि q होगी

03:45

पर छवि की तुलना में बहुत अधिक धुँधली

03:48

वर्तमान चरण v और यह बहुत कठिन होगा

03:50

समान पैच खोजने के लिए इसे दोहराया जाता है

03:53

जब तक हम शीर्ष पर वापस नहीं आ जाते

03:54

उच्च संकल्प परिणामों के साथ पिरामिड

03:57

तो ये सभी उत्पन्न पैच हैं

03:59

एक वीडियो और वॉइला में तब्दील किया जा सकता है

04:02

इसे विभिन्न शोरों के साथ दोहराएं या

04:04

किसी भी भिन्नता को उत्पन्न करने के लिए संशोधन

04:06

आप अपने वीडियो पर चाहते हैं चलो जल्दी करते हैं

04:09

रीकैप छवि को कम किया गया है

04:11

कई पैमानों पर शोर जोड़ा जाता है

04:13

कोर्सा स्केल छवि जिसे विभाजित किया गया है

04:16

छोटे चौकोर पैच प्रत्येक शोर पैच है

04:18

फिर सबसे समान के साथ बदल दिया

04:20

एक ही संकुचित छवि से पैच

04:23

बिना शोर के कुछ यादृच्छिक परिवर्तन हो रहे हैं

04:26

छवि में यथार्थवाद रखते हुए दोनों

04:28

नव निर्मित छवि और छवि

04:31

इस कदम के शोर के बिना upscaled हैं

04:33

और सबसे समान खोजने की तुलना में

04:36

निकटतम पड़ोसी के साथ फिर से पैच

04:38

ये सबसे समान पैच तब हैं

04:40

वर्तमान में छवि से चुना गया

04:42

के लिए एक नई छवि उत्पन्न करने का संकल्प

04:45

कदम फिर से और हम इसे दोहराते हैं

04:47

अपस्केलिंग और चरणों की तुलना तब तक करें जब तक हम

04:49

पिरामिड के शीर्ष पर वापस जाएं

04:52

उच्च संकल्प परिणाम निश्चित रूप से

04:54

परिणाम सही नहीं हैं आप अभी भी कर सकते हैं

04:56

कुछ कलाकृतियों को देखें जैसे लोग दिखाई दे रहे हैं

04:58

और अजीब जगहों पर गायब हो जाना or

05:00

बस किसी में किसी को कॉपी-पेस्ट करना

05:02

मामले इसे बहुत स्पष्ट करते हैं यदि आप

05:05

इस पर ध्यान केंद्रित करें अभी भी यह केवल पहला है

05:07

वीडियो जोड़तोड़ के साथ कागज पर हमला

05:09

निकटतम पड़ोसी एल्गोरिथ्म और

05:11

इसे उच्च संकल्प के लिए मापनीय बनाना

05:13

वीडियो देखना हमेशा शानदार होता है

05:15

विभिन्न दृष्टिकोण मैं बहुत उत्साहित हूँ

05:18

अगले पेपर में सुधार देखने के लिए

05:20

यह भी परिणाम अभी बाकी है

05:22

काफी प्रभावशाली और उनका उपयोग किया जा सकता है

05:24

मॉडल के लिए डेटा वृद्धि उपकरण के रूप में

05:26

बहुत कम होने के कारण वीडियो पर काम करना

05:29

रन टाइम अन्य मॉडलों को प्रशिक्षित करने की अनुमति देता है

05:31

बड़े और अधिक विविध डेटा सेट पर

05:33

बिना अधिक लागत के यदि आप रुचि रखते हैं

05:35

इस तकनीक के बारे में अधिक जानने में i

05:37

उनके पढ़ने की जोरदार सिफारिश करेंगे

05:38

कागज में यह पहली कड़ी है

05:40

विवरण देखने के लिए धन्यवाद और

05:42

मेरे काम का समर्थन करने वाले सभी लोगों के लिए

05:44

patreon या टिप्पणी करके और पसंद करके

05:46

यूट्यूब पर यहां वीडियो

05:54

इसलिए आप

अंग्रेज़ी (स्वतः जेनरेट)

सब

हाल ही में अपलोड किया गया

देखे हुए

टैग

हैकर दोपहर में शामिल हों

अपने कस्टम पढ़ने के अनुभव को अनलॉक करने के लिए अपना निःशुल्क खाता बनाएं।

प्लेटोए. Web3 फिर से कल्पना की गई। डेटा इंटेलिजेंस प्रवर्धित।
एक्सेस करने के लिए यहां क्लिक करें।

स्रोत: https://hackernoon.com/this-ai-performs-seamless-video-manipulation-without-deep-learning-or-datasets?source=rss

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी

हमारे साथ चैट करें

नमस्ते! मैं आपकी कैसे मदद कर सकता हूँ?