شعار زيفيرنت

مساعدون مفيدون أم شركاء رومانسيون أم فنانون محتالون؟ الجزء الأول » مدونة CCC

التاريخ:

دعمت CCC ثلاث جلسات علمية في مؤتمر AAAS السنوي لهذا العام، وفي حالة عدم تمكنك من الحضور شخصيًا، فسوف نقوم بتلخيص كل جلسة. سنلخص هذا الأسبوع أبرز العروض التي قدمها المشاركون في الجلسة، “نماذج اللغات الكبيرة: مساعدون مفيدون، شركاء رومانسيون أم فنانون محتالون؟"هذه اللجنة، أدارها دكتورة ماريا جيني، عضو مجلس CCC وأستاذ علوم وهندسة الكمبيوتر في جامعة مينيسوتا دكتور إيجي كامار، المدير الإداري لـ AI Frontiers في Microsoft Research، الدكتور هال دوميه الثالث، أستاذ علوم الكمبيوتر في جامعة ميريلاند، و دكتور جوناثان ماي، أستاذ علوم الكمبيوتر في معهد علوم المعلومات بجامعة جنوب كاليفورنيا.

تعد نماذج اللغات الكبيرة في طليعة المحادثات في المجتمع اليوم، ولا تزال هيئة المحلفين تناقش ما إذا كانت ترقى إلى مستوى الضجيج المحيط بها. تناول أعضاء اللجنة في جلسة AAAS إمكانيات وتحديات وإمكانات LLMs.

وكان المتحدث الأول هو الدكتور إيجي كامار (أبحاث مايكروسوفت). ووصفت الوضع الحالي للذكاء الاصطناعي بأنه "مرحلة انتقالية". لقد قدمت وجهة نظر فريدة من نوعها باعتبارها شخصًا شهد التغيرات في الذكاء الاصطناعي في الصناعة، والنمو الهائل في نماذج التعلم العميق التي توقع عدد قليل جدًا من الناس استمرارها حتى عام 2024.

كان سبب النمو هو زيادة كمية البيانات التي يتم تدريب حاملي ماجستير القانون عليها، والبنية الأكبر التي تسمى المحولات. إحدى الأفكار المثيرة للاهتمام التي شاركها الدكتور قمر على الرسم البياني هي أن النماذج تتوسع بسرعة كبيرة لأنها تم تدريبها في البداية على مهمة معينة؛ مهمة يمكنهم القيام بها بشكل موثوق. أظهر ChatGPT أنه إذا قمت بالتوسيع بشكل كبير بما فيه الكفاية، بما في ذلك عدد المعلمات التي يأخذها النموذج في الاعتبار، فيمكن للنماذج البدء في إكمال المهام بأداء مماثل للنموذج الذي تم تدريبه لإكمال نفس المهام على وجه التحديد.

هذا هو تعريف المرحلة الانتقالية لمرحلة LLM: لم تعد النماذج بحاجة إلى تدريب محدد لمهمة محددة، ولكن يمكن تدريبها بشكل عام ومن ثم تنفيذ العديد من المهام. وليس هناك ما يشير إلى أن نمو هذه القدرات آخذ في التباطؤ.

تمكنت الدكتورة قمر من الوصول مبكرًا إلى GPT-4، وخلال وقتها الطويل في اختباره، أعجبت بالتحسينات الكبيرة التي تم إدخالها عليه والتي جاءت مع الحجم والبيانات، وحقيقة أنه يمكنه إنجاز مهام مختلفة بشكل متزامن.

ماذا يحمل المستقبل لهذه LLMs؟ ويتوقع الدكتور قمر أن طلاب ماجستير اللغة سوف يتجاوزون اللغة البشرية، ويتعلمون لغة الآلة ويكونون قادرين على الترجمة بين اللغتين. وهذا من شأنه أن يعزز قدرات الطرائق في المدخلات والمخرجات، مما قد يؤدي إلى أن تكون النماذج قادرة ليس فقط على توليد اللغة، ولكن أيضًا الإجراءات والتنبؤات في السلوكيات.

بعد ذلك، تحدث الدكتور قمر عن التحول الهام الذي يحدث في مجال الحوسبة. يتم تطوير الأنظمة بشكل مختلف تمامًا اليوم، وسيتطلب هذا التطور إنشاء نموذج حاسوبي جديد لم نتطرق إليه إلا في هذا الوقت. ستبدو الطريقة التي نتفاعل بها مع أجهزة الكمبيوتر مختلفة كثيرًا في السنوات القادمة، وسيتطلب هذا إعادة التفكير في التفاعل بين الإنسان والحاسوب (HCI).

التغيير الآخر هو الطريقة التي سيعمل بها البشر للمضي قدمًا. أجرت مايكروسوفت دراسات تفيد بأن إنتاجية العمال يمكن أن تتضاعف من حيث سطور التعليمات البرمجية المكتوبة عندما يساعدها الذكاء الاصطناعي. وهذا إنجاز لا يصدق، ولكن الطريقة التي تعمل بها هذه التكنولوجيا ومن أين يأتي ذكائها غير معروف إلى حد كبير، لذلك هناك الكثير من الأسئلة البحثية في هذا المجال.

هناك أيضًا الكثير من الأسئلة حول إساءة الاستخدام المحتملة لـ LLMs مثل هذه. وهناك مخاوف بشأن العدالة، والمخاطر الديموغرافية المختلفة، وغير ذلك من العواقب الأكثر خطورة. وفي حين أن هناك إمكانات كبيرة للاكتشافات العلمية، إلا أن هناك أيضًا إمكانية كبيرة للضرر؛ على سبيل المثال، إقناع الآباء بعدم تطعيم أطفالهم، أو إقناع الطفل بفعل شيء سيئ، أو إقناع شخص ما بأن العالم مسطح. لقد تم بذل الكثير من جهود السلامة في تطوير LLMs، ويمكن أن تكون المصادر المفتوحة مفيدة جدًا لإحراز تقدم في هذا المجال أيضًا.  

ثم طرح الدكتور قمر أسئلة على المجتمع العلمي:

  • كيف سيتغير العلم مع اضطراب الذكاء الاصطناعي؟
  • هل نتخذ خطوات لتغيير طريقة تعليم وتدريب الجيل القادم؟
  • هل تقومون ببناء بنية تحتية تكنولوجية للاستفادة من هذه المرحلة الانتقالية؟
  • هل نعد الأجيال القادمة للعالم الجديد؟

أخيرًا، أكد الدكتور قمر على أن أحد الجوانب الأساسية لمرحلة الانتقال الملحوظة هو السرعة التي تتطور بها ماجستير إدارة الأعمال. تتحسن هذه النماذج بشكل ملحوظ في فترة زمنية قصيرة جدًا، وأمام الباحثين في مجال الحوسبة الكثير مما يتعين عليهم القيام به.

بدأ المتحدث الثاني، الدكتور هال دوميه الثالث (جامعة ميريلاند)، حديثه بتوضيح أنه ينبغي تطوير نماذج الذكاء الاصطناعي لمساعدة الناس على القيام بالأشياء التي يريدون القيام بها؛ زيادة العمل البشري، وليس الأتمتة. لقد انتشرت رؤية الأتمتة هذه في المجتمع منذ الستينيات. بدلًا من مساعدة الناس على لعب الشطرنج بشكل أفضل، صمم العلماء نظامًا يلعب الشطرنج بمفرده.

هذه الفلسفة لن تذهب إلى أي مكان. لا يزال الذكاء الاصطناعي اليوم يستحق النشر بمجرد أن يكون ذكيًا بما يكفي للقيام بمهمة بمفرده. هذا عميق في دماء الذكاء الاصطناعي. قبل إنفاق الوقت والمال على أتمتة النظام، يجب علينا أولاً أن نتوقف ونتساءل هل هذا في مصلحتنا؟

دفع الدكتور دوميه بمفهوم التعزيز: كيف يمكن استخدام الذكاء الاصطناعي كأداة؟ تعمل أنظمة مثل Github copilot على زيادة الإنتاجية، لكن زيادة الإنتاجية ليست كافية. قال أحد مستخدمي النظام إنه يتيح لهم التركيز على أجزاء من البرمجة كانت ممتعة، وهو ما يتماشى أكثر مع كيفية بناء الذكاء الاصطناعي.

لا ينبغي لباحثي الذكاء الاصطناعي أن يرغبوا في إزالة الأجزاء الممتعة من وظيفة الشخص؛ يجب عليهم إعطاء الأولوية لإزالة الكدح. يجب أن تعمل على تحسين حياة البشر بدلاً من مجرد تحسين النتيجة النهائية للشركة.

شارك الدكتور دوميه في تأليف ورقة بحثية تثير هذه النقاط، وظهرت الحجة المضادة أنه من المنظور الفني، فإن بناء الأنظمة التي تستخدم تكنولوجيا التعلم الآلي على وجه الخصوص غالبًا ما يكون أتمتتها أسهل بكثير من زيادتها. وذلك لأن البيانات اللازمة لتدريب النظام الذي سيقوم بتدريب النظام من السهل الحصول عليها. نحن نقدم هذه المعلومات من خلال أداء وظائفنا، ومن السهل تدريب تعلم الآلة على محاكاة السلوك البشري. من الصعب جدًا تعليم نظام لمساعدة شخص ما على إكمال المهمة. هذه المعلومات متناثرة بين مراجعات الأدبيات من NSF، والكتابة على قطعة من الورق بواسطة مبرمج، وما إلى ذلك. ولا يتم تسجيل البيانات اللازمة لمساعدة الإنسان على القيام بالمهام.

هناك جانب رئيسي آخر لبناء أنظمة مفيدة وهو سؤال المستخدم عن الأنظمة التي قد تكون مفيدة لحياته. على سبيل المثال، تختلف احتياجات المكفوفين كثيرًا عن احتياجات المبصرين (والتي تختلف أيضًا عما يحتاجه المبصرون) اعتقد احتياجات المكفوفين هي). أحد الأمثلة التي شاركها الدكتور دومي هو أن النظام البصري قد يكشف أن الجسم ما هو عبارة عن علبة صودا، لكن الشخص الكفيف يمكنه عادةً معرفة ذلك بمفرده. ستكون مكونات الصودا أكثر فائدة لهم. هناك فجوة هائلة بين جودة استجابات الأنظمة لمجرد فهم الأسئلة ومعالجة الأسئلة المتعلقة بإمكانية الوصول، وهذه الفجوة آخذة في الاتساع.

مثال إضافي على أهمية تحديد احتياجات المجتمع أولاً قبل إنشاء التكنولوجيا "لمساعدتهم" هو الإشراف على المحتوى. يشارك العديد من مشرفي المحتوى المتطوعين في العمل لأنهم يريدون جعل العالم مكانًا أفضل، والمساعدة في بناء مجتمع يعتقدون أنه مهم. عند سؤالهم عن نوع الأداة التي يريدون مساعدتها في دورهم، غالبًا لا يريدون أن تكون وظيفتهم مؤتمتة بالكامل، بل يريدون فقط أن تكون الأجزاء المملة مثل البحث في سجل الدردشة أسهل.

يختتم الدكتور دومي هذه المناقشة بمثال أخير لوالدته المحبة للسيارات والتي تحب السيارات وترفض قيادة السيارات الأوتوماتيكية. لقد اختارت ناقل الحركة اليدوي، ومن المهم حقًا أن يكون لديها هذا الاختيار. يجب أن يتحكم الأشخاص فيما إذا كانوا يريدون أتمتة مهامهم أم لا.

يواصل الدكتور دوميه المحادثة من خلال تقديم بدائل للأساليب الحالية لتكنولوجيا إمكانية الوصول. على سبيل المثال، عند إنشاء أداة حول التعرف على لغة الإشارة، بدلاً من البحث على الإنترنت عن مقاطع فيديو لأشخاص يوقعون (وهو ما ينطوي على الكثير من المخاوف المتعلقة بالموافقة والخصوصية، بالإضافة إلى أن معظم مقاطع الفيديو هذه هي لمحترفين وبدون ضوضاء/تشتيت في الخلفية وهو أمر غير مناسب). واقعيًا)، تواصل مع المجتمع وابدأ مشروعًا يمكّنهم من إرسال مقاطع فيديو لتدريب الأدوات. تعتبر استراتيجيات المجتمع أولاً مثل هذه أكثر أخلاقية ومسؤولية، وتمنح المستخدمين المزيد من التحكم. 

ويخلص الدكتور دومي إلى أنه ينبغي تطوير ماجستير إدارة الأعمال والأدوات الأخرى لإعطاء الأولوية للفائدة، وليس الذكاء. كلما كانت مفيدة أكثر، كلما تمكنت من مساعدة الأشخاص على القيام بشيء لا يستطيعون القيام به أو لا يريدون القيام به، بدلاً من أتمتة شيء يفعله الأشخاص جيدًا بالفعل ويستمتعون به.

وكان الدكتور جوناثان ماي (معهد علوم المعلومات بجامعة جنوب كاليفورنيا) هو المتحدث التالي، وبدأ حديثه بالتأمل في موضوع المؤتمر: "نحو علم بلا جدران". ويفترض أنه في حين أن التطوير الأخير لماجستير القانون في القانون يزيل الجدران بالنسبة لبعض الناس، فإنه يبني الجدران بالنسبة للكثيرين.

يناقش أولاً كيف ساهم الإنترنت في خفض العديد من الحواجز أمام إجراء الأبحاث؛ عندما كان عمره 17 عامًا، تساءل عن سبب تشابه حبكات Star Wars وLord of the Rings، وكان عليه أن يقود سيارته إلى المكتبة ويجد كتابًا يحتوي على الإجابة. لقد أجرى بحثًا عالي المخاطر ولكنه شاق بنفس القدر لأطروحته للدكتوراه، ولكن بحلول نهاية وقت دراسته، تم إنشاء صفحة ويكيبيديا حول هذا الموضوع، ثم البحث على الإنترنت، والآن أصبح البحث بدون سيارات هو القاعدة.

وتابع الدكتور ماي بالقول إنه يشعر بالفخر لكونه ضمن الفئة الديموغرافية للجمهور المستهدف من حاملي الماجستير في القانون. إنه لا يقوم بالبرمجة في كثير من الأحيان ولم يتعلم أبدًا الكثير من مهارات البرمجة، ولكن عندما يحتاج إليها في عمله، يمكنه أن يسأل ChatGPT وهو يقوم بعمل رائع. 

ومع ذلك، هناك الكثير من العوائق التي تحول دون تعميم فائدة LLM:

  • جدران اللغة: تعمل النماذج بشكل أفضل كلما زاد عدد البيانات التي يتم تدريبها عليها. على الرغم من أن برامج LLM التجارية اليوم متعددة اللغات، إلا أنها تركز بشكل كبير على اللغة الإنجليزية. على سبيل المثال، تم تدريب ChatGPT على 92% من اللغة الإنجليزية. علاوة على ذلك، فإن بيانات التعليمات، والتي تعد "الصلصة السرية" لمجالس LLM، هي في الغالب باللغة الإنجليزية (96% من ChatGPT على سبيل المثال). توجد حاليًا جهود قليلة جدًا لتحسين الأداء عبر اللغات لهذه النماذج على الرغم من فجوات الأداء المنهجي في الاختبارات الحالية، وهو أمر منطقي بسبب الإجماع العام على أن الترجمة الآلية (MT) "تم حلها" ويجب تركيز الجهود على مهام أخرى.
  • جدران الهوية: إذا سألت ChatGPT عما يجب عليك فعله في عيد الميلاد، فإنه يركز على الأنشطة والتقاليد المختلفة التي يمكنك المشاركة فيها؛ لم يذكر أنه يمكنك الذهاب إلى العمل. لقد ثبت أن حاملي شهادة الماجستير في القانون يتصرفون بشكل مختلف عند وصف المجموعات السكانية المختلفة، ويعبرون عن المزيد من المشاعر السلبية وحتى السمية الصريحة في بعض الحالات. هناك احتمالات للجمل النمطية التي يمكن أن تسبب ضررًا في مجتمعات مثل LGBTQ+ أو اليهودية؛ هناك الكثير من التحيز في جميع المجالات، وهذا له عواقب على عملية صنع القرار المنتشرة. هناك بعض الضمانات المضمنة، والأسئلة الاستقصائية الأكثر وضوحًا من غير المرجح أن تتلقى إجابات سامة، ولكن النماذج تفضل على الأرجح البيانات والنتائج النمطية، وهنا حيث توجد أضرار خاصة عند استخدام النماذج في القدرات النهائية حيث لا ترى الناتج (أي أهلية القرض). وقدم مثالاً على ماجستير إدارة الأعمال الذي يظهر تحيزًا عند إنشاء وجوه للأفراد بناءً على وظائفهم؛ تظهر الوظائف ذات الأجور المنخفضة كنساء وأقليات، في حين أن الوظائف ذات الأجر الأعلى هي للذكور البيض.
  • الجدران البيئية (البرمجيات): تتطلب LLMs قدرًا كبيرًا من الطاقة لإنتاجها وتشغيلها. حتى أكثر الكائنات الحية الحية "تواضعًا" تستخدم طاقة سنوية أكثر بثلاثة أضعاف من استخدام شخص واحد. هناك أيضًا فجوة كبيرة في البيانات الخاصة بأكبر نماذج اللغات مثل ChatGPT، لكن الشركات التي تمتلكها ترفض صراحة الوصول إلى استهلاكها من الطاقة.
  • الجدران البيئية (الأجهزة): من أجل إنتاج الرقائق، التي تتطلبها جميع حاملي شهادة الماجستير في القانون، فأنت بحاجة إلى "مواد صراع" مثل التنتالوم (المستخرج في الكونغو)، والهافنيوم (المستخرج في السنغال وروسيا). في الولايات المتحدة، من المفترض أن تقوم الشركات بالإبلاغ عن كمية معادن النزاع التي تستخدمها، لكن الولايات المتحدة تظهر علنًا انخفاضًا في استخدام هذه المواد، وهو ما لا يمكن أن يكون صحيحًا. أبعد من ذلك، هناك الكثير من المشاكل الاجتماعية والسياسية مثل قيام الصين بتقييد الجرمانيوم والجاليوم ردا على القيود المفروضة على الصادرات الأمريكية.

يوضح الدكتور ماي أن هذه الفئات تكشف عن بعض المشكلات العديدة المتعلقة بالأضرار التي تسببها LLMs، والحالات التي لا يستفيد فيها الأشخاص. هناك سبب للقلق، ولكن هناك أيضًا فرص للبحث و/أو تغييرات السلوك التي من شأنها التخفيف من بعض هذه الأضرار:

  • اللغة: تخصيص المزيد من التمويل البحثي للتعددية اللغوية (وليس فقط الترجمة المهيمنة من وإلى اللغة الإنجليزية).
  • الهوية: بحث تصاعدي وشامل للمجتمع. تعديل النموذج واختباره قبل النشر
  • البيئة: تطوير الخوارزمية التي تستخدم بيانات أقل وتغير معلمات أقل (مثل LoRA، المحولات، أوامر الشراء غير RL). كن واعيًا بشأن الحوسبة وأصر على الانفتاح على المستويات التنظيمية 

اختتم د.

شكرًا جزيلاً على القراءة، ويرجى المتابعة غدًا لقراءة ملخص جزء الأسئلة والأجوبة من الجلسة.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة