ओपनएआई, चैटजीपीटी और सोरा जैसे अभूतपूर्व उपकरणों के पीछे की प्रभावशाली कृत्रिम बुद्धिमत्ता अनुसंधान प्रयोगशाला, अपने मुख्य प्रौद्योगिकी अधिकारी, मीरा मुराती के साथ हाल ही में एक साक्षात्कार के बाद खुद को मुश्किल में डाल रही है।
साक्षात्कारवॉल स्ट्रीट जर्नल रिपोर्टर जोआना स्टर्न द्वारा संचालित, ओपनएआई की नवीनतम छवि, या बल्कि वीडियो, जेनरेशन सिस्टम पर केंद्रित है। सोरा.
चिंताएं एआई मॉडल को प्रशिक्षित करने के लिए कॉपीराइट किए गए कार्य के संभावित दुरुपयोग के इर्द-गिर्द केंद्रित हैं पारदर्शिता की कमी अपनी डेटा प्रथाओं के संबंध में OpenAI से।
सोरा का प्रशिक्षण डेटा सवालों के घेरे में है
विवाद के मूल में प्रशिक्षण डेटा का मुद्दा है, एआई मॉडल को प्रशिक्षित करने के लिए उपयोग किए जाने वाले विशाल डेटासेट.
सोरा के लिए उपयोग किए गए डेटा के स्रोतों के बारे में पूछे जाने पर, मुराती ने मानक प्रतिक्रिया दी: मॉडल को "पर प्रशिक्षित किया गया था"सार्वजनिक रूप से उपलब्ध और लाइसेंस प्राप्त डेटा".
हालाँकि, आगे की जांच से इस डेटासेट के विशिष्ट विवरण के बारे में मुराती की ओर से झिझक और अनिश्चितता सामने आई।
यह प्रतिक्रिया है लाल झंडे उठाए कलाकारों, फ़ोटोग्राफ़रों और बौद्धिक संपदा विशेषज्ञों के बीच। एआई छवि निर्माण प्रणाली भारी मात्रा में छवियों को ग्रहण करने पर निर्भर करती है, जिनमें से कई को कॉपीराइट द्वारा संरक्षित किया जा सकता है। सोरा के प्रशिक्षण डेटा के बारे में स्पष्टता की कमी इस बात पर सवाल उठाती है कि क्या OpenAI ने सामग्री निर्माताओं के अधिकारों की पर्याप्त सुरक्षा की है।
शटरस्टॉक का उपयोग बाद में स्वीकार किया गया
आग में घी डालने का काम मुराती ने यह बताने से शुरू में इनकार कर दिया था कि शटरस्टॉक छवियां सोरा के प्रशिक्षण डेटासेट का एक घटक थीं या नहीं। साक्षात्कार के बाद ही, वॉल स्ट्रीट जर्नल द्वारा जोड़े गए एक फ़ुटनोट में, मुराती ने शटरस्टॉक की छवि लाइब्रेरी के उपयोग की पुष्टि की।
यह पुष्टि OpenAI के सार्वजनिक-सामना वाले रुख का खंडन करती है "सार्वजनिक रूप से उपलब्ध और लाइसेंस प्राप्त डेटा” और संभावित समस्याग्रस्त सोर्सिंग प्रथाओं को छिपाने का प्रयास करने का सुझाव देता है।
शटरस्टॉक और ओपनएआई का गठन हुआ साझेदारी DALL-E 2 और संभावित सोरा जैसे छवि निर्माण मॉडल के प्रशिक्षण में शटरस्टॉक की छवि लाइब्रेरी का उपयोग करने के लिए OpenAI अधिकार प्रदान करना।
बदले में, शटरस्टॉक योगदानकर्ताओं (फोटोग्राफर और कलाकार जिनकी छवियां मंच पर हैं) को मुआवजा मिलता है जब उनके काम का उपयोग इन एआई मॉडल के विकास में किया जाता है।
एक पीआर दुःस्वप्न सामने आता है
यह कहना सुरक्षित है कि अधिकांश जनसंपर्क लोग इस साक्षात्कार को पीआर मास्टरपीस नहीं मानेंगे।
मुराती की स्पष्टता की कमी OpenAI के लिए संवेदनशील समय पर आई है, पहले से ही प्रमुख कॉपीराइट मुकदमों का सामना कर रहा है, जिसमें न्यूयॉर्क टाइम्स द्वारा दायर एक महत्वपूर्ण मामला भी शामिल है।
जनता मॉडल प्रशिक्षण के लिए ओपनएआई द्वारा यूट्यूब वीडियो के कथित गुप्त उपयोग जैसी प्रथाओं की जांच कर रही है पहले सूचना द्वारा रिपोर्ट किया गया था. कलाकारों से लेकर राजनेताओं तक सभी हितधारक जवाबदेही की मांग कर रहे हैं, ऐसे में मुराती का बचना आग में घी डालने का काम करता है।
OpenAI का अपारदर्शी दृष्टिकोण शानदार ढंग से उलटा पड़ रहा है, सोरा साक्षात्कार को पीआर आपदा में बदलना.
ओपनएआई सीटीओ मीरा मुराती का कहना है कि सोरा को सार्वजनिक रूप से उपलब्ध और लाइसेंस प्राप्त डेटा पर प्रशिक्षित किया गया था pic.twitter.com/rf7pZ0ZX00
- ज़ारथुस्त्र (@tsarnick) मार्च २०,२०२१
पारदर्शिता यूं ही सर्वाधिक चर्चा का विषय नहीं है
यह घटना एक गंभीर सच्चाई को रेखांकित करती है: एआई की दुनिया में सच्चाई का अनावरण करना सर्वोपरि है। ओपनएआई की लड़खड़ाती प्रतिक्रियाओं ने सार्वजनिक विश्वास को गंभीर रूप से कम कर दिया है और इसकी नैतिक प्रथाओं के बारे में सवाल तेज हो गए हैं। सोरा विवाद बढ़ती एकजुटता को उजागर करता है एआई उद्योग के भीतर अधिक जवाबदेही की मांग.
सोरा के प्रशिक्षण डेटा नस्लों की विशिष्टताओं का खुलासा करने में मुराती की अनिच्छा अविश्वास और एक खतरनाक मिसाल कायम करता है.
स्पष्टता के बिना कलाकार, निर्माता और जनता मांग कर रहे हैं, नैतिक बहस और कानूनी कार्रवाई की संभावना केवल तेज होगी।
इस भूमि में कोई देवदूत नहीं हैं
हालाँकि वर्तमान जाँच का अधिकांश भाग OpenAI पर पड़ता है, यह याद रखना महत्वपूर्ण है वे खेल में एकमात्र खिलाड़ी नहीं हैं.
फेसबुक एआई रिसर्च एलएलएएमए मॉडल और गूगल का मिथुन समस्याग्रस्त प्रशिक्षण डेटा स्रोतों के आरोपों का भी सामना करना पड़ा है।
यह आश्चर्य की बात नहीं है, जैसे बिजनेस इनसाइडर की रिपोर्ट जिसे मेटा पहले ही स्वीकार कर चुका है इंस्टाग्राम और फेसबुक पोस्ट का उपयोग करना अपने AI मॉडल को प्रशिक्षित करने के लिए। इसके अतिरिक्त, इंटरनेट के विशाल क्षेत्र पर Google का नियंत्रण उन्हें संभावित प्रशिक्षण डेटा तक अद्वितीय पहुंच प्रदान करता है, सहमति और कॉपीराइट के बारे में समान नैतिक चिंताओं को बढ़ाता है।
ओपनएआई के सोरा के साथ स्थिति यह है एक बड़ी पहेली का सिर्फ एक टुकड़ा. संपूर्ण एआई विकास क्षेत्र को अपनी डेटा प्रथाओं और संभावित नैतिक प्रभावों के संबंध में जांच का सामना करना पड़ रहा है।
विशेष रुप से प्रदर्शित छवि क्रेडिट: Freepik.
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://dataconomy.com/2024/03/15/openai-sora-training-data-controversy/