شعار زيفيرنت

نيويورك تايمز تقاضي OpenAI و Microsoft بسبب بيانات التدريب

التاريخ:

رفعت صحيفة نيويورك تايمز دعوى قضائية ضد مايكروسوفت وOpenAI، بدعوى أن الثنائي انتهكا حقوق الطبع والنشر للصحيفة من خلال استخدام مقالاتها دون إذن لبناء ChatGPT ونماذج مماثلة. إنها أول مؤسسة إعلامية أمريكية كبرى تسحب الثنائي التكنولوجي إلى المحكمة بشأن استخدام القصص في بيانات التدريب.

كما هو الحال مع الدعاوى المماثلة - بما في ذلك عمل التقطها العديد من الفنانين والمبدعين، مثل سارة سيلفرمان – نيويورك تايمز شكوى [PDF] يتمحور حول استخدام المواد المحمية بحقوق الطبع والنشر - في هذه الحالة من The Times - في تدريب نماذج اللغات الكبيرة (LLMs) التي تقف وراء العديد من برامج الدردشة الآلية من Microsoft وOpenAI وخدمات الذكاء الاصطناعي التوليدية.

تستدعي الشكوى شركة Microsoft، ليس فقط للاستثمار الذي قامت به في OpenAI، ولكن أيضًا للمساعدين مثل Microsoft 365 Copilot وBing Chat التي تزعم الشكوى أنها: "عرض محتوى الأوقات في المخرجات التوليدية بطريقتين على الأقل: (1) من خلال عرض النسخ "المحفوظة" أو المشتقات من أعمال Times المستردة من النماذج نفسها، و(2) من خلال عرض نتائج بحث تركيبية تشبه إلى حد كبير أعمال Times التي تم إنشاؤها من النسخ المخزنة في فهرس بحث Bing."

وتشعر الصحيفة بالانزعاج الشديد لأن "الملايين" من مقالاتها المحمية بحقوق الطبع والنشر قد تم حصادها لتشكل جزءًا من نماذج ميكروسوفت وOpenAI دون إذن، وأن هذه الشبكات العصبية ستعيد هذا العمل عند الطلب من المستخدمين، ومرة ​​أخرى دون إذن.

في شكواها، تقدم صحيفة نيويورك تايمز أمثلة تدعي أنها تثبت أن ChatGPT تم تدريبها على محتواها. علاوة على ذلك، يبدو أن سؤال ChatGPT البسيط للتهرب من حظر الاشتراك غير المدفوع يؤدي إلى ردود تحتوي على نص محمي بحقوق الطبع والنشر.

وكان التهرب من نظام حظر الاشتراك غير المدفوع في عملية استخراج محتوى OpenAI هو الذي اجتذب تدقيقًا خاصًا. وفقًا للشكوى، بدأت الصحيفة في إخفاء عملها خلف نظام حظر الاشتراك غير المدفوع قبل 12 عامًا، واعتبارًا من الربع الثالث من عام 2023، طالبت بـ 10.1 مليون مشترك رقمي ومطبوع. وتهدف إلى زيادة هذا العدد إلى 15 مليونًا بحلول نهاية عام 2027.

يتم أيضًا الاهتمام بالقراء العرضيين، مع حرية الوصول إلى عدد محدود من المقالات قبل طلب الاشتراك. وتعتقد صحيفة نيويورك تايمز أنها تجتذب ما بين 50 إلى 100 مليون مستخدم أسبوعيًا بمثل هذا النهج، مع زيادة الإعلانات التي تملأ خزائنها.

توضح الشكوى: "تعتمد التايمز على حقوقها الحصرية في النسخ والتعديل والنشر والأداء والعرض بموجب قانون حقوق الطبع والنشر لمقاومة هذه القوى. لقد سجلت صحيفة التايمز حقوق الطبع والنشر في نسختها المطبوعة كل يوم لأكثر من 100 عام، وتحتفظ بنظام حظر الاشتراك غير المدفوع، وطبقت شروط الخدمة التي تضع حدودًا على نسخ واستخدام محتواها. لاستخدام محتوى التايمز لأغراض تجارية، يجب على الطرف أولاً التواصل مع التايمز بشأن اتفاقية الترخيص.

ومع ذلك، ولجذب الزيارات إلى موقعها، تسمح صحيفة نيويورك تايمز أيضًا لمحركات البحث بالوصول إلى محتواها وفهرسته. "متأصل في تبادل القيمة هذا فكرة أن محركات البحث ستوجه المستخدمين إلى مواقع الويب وتطبيقات الهاتف المحمول الخاصة بـ The Times، بدلاً من استغلال محتوى The Times لإبقاء المستخدمين داخل نظام البحث البيئي الخاص بهم."

لاستخدام محتوى التايمز لأغراض تجارية، يجب على الطرف أولاً التواصل مع التايمز بشأن اتفاقية الترخيص

وأضافت التايمز أنها لم تسمح أبدًا لأي شخص - بما في ذلك Microsoft وOpenAI - باستخدام محتواها لأغراض الذكاء الاصطناعي التوليدية. وهنا تكمن المشكلة. ووفقًا للصحيفة، فقد اتصلت بشركة Microsoft وOpenAI في أبريل 2023 للتعامل مع المشكلة وديًا. وقالت بصراحة: "هذه الجهود لم تسفر عن قرار".

وهكذا نجد أنفسنا أمام شكوى تزعم وجود "نموذج عمل يعتمد على التعدي الجماعي على حقوق الطبع والنشر" وتعرض تفاصيل رحلة شركة OpenAI منذ بداياتها باعتبارها "شركة أبحاث ذكاء اصطناعي غير ربحية" في عام 2015 إلى شركة اليوم العملاقة.

وفقًا للشكوى: "على الرغم من وعودها المبكرة بالإيثار، سرعان ما أصبحت OpenAI شركة ربحية بمليارات الدولارات مبنية إلى حد كبير على الاستغلال غير المرخص للأعمال المحمية بحقوق الطبع والنشر المملوكة لصحيفة التايمز وغيرها."

اذا مالعمل؟ ومن غير المستغرب أن تسعى صحيفة نيويورك تايمز للحصول على تعويضات. كما يطالب بمحاكمة أمام هيئة محلفين ويريد من المحكمة أن تأمر بتدمير "جميع نماذج GPT أو غيرها من نماذج LLM ومجموعات التدريب التي تتضمن أعمال Times."

في وقت سابق من هذا الشهر، أعلن Axel Springer وOpenAI عن خطة لتقديم ملخصات لمحتوى الأول - بما في ذلك المحتوى المدفوع - المتاحة من منتجات الأخير، بما في ذلك ChatGPT. تهدف الخطة إلى التأكد من أن الإجابات على استفسارات المستخدم تتضمن الإسناد والروابط للمقالات الكاملة.

كم كانت قيمة الصفقة غير واضح. وفقا لصحيفة فايننشال تايمز، كان هناك مبلغ من ثمانية أرقام. وكما هو مذكور في شكواها، أجرت صحيفة نيويورك تايمز أيضًا مناقشات، ولكن من الواضح أن النتيجة كانت غير مرضية. ®

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة