تقدم Microsoft إطار عمل التحسين الفوري التلقائي لـ LLMs

قدمت Microsoft AI Research مؤخرًا إطارًا جديدًا يسمى التحسين الفوري التلقائي (APO) لتحسين أداء نماذج اللغات الكبيرة (ماجستير). تم تصميم إطار العمل هذا لمساعدة المستخدمين على إنشاء مطالبات أفضل مع الحد الأدنى من التدخل اليدوي والتحسين الهندسة السريعة لنتائج أفضل. في هذه المقالة ، نتعمق في تفاصيل APO وتأثيرها المحتمل على مهام البرمجة اللغوية العصبية. أولاً ، لنبدأ بتعريفه.

تقدم Microsoft AI Research APO ، وهو إطار عمل بسيط وعامة الأغراض للتحسين التلقائي لمطالبات LLM التي تقلل بشكل كبير جهود المطالبة اليدوية

ما هو APO؟

APO هو إطار عمل بسيط وعامة الأغراض يعمل تلقائيًا على تحسين المطالبات لـ LLM. إنها خوارزمية تحسين سريع غير معلمية مستوحاة من نزول التدرج العددي. تربط الخوارزمية بين نهجين آليين حاليين لمساعدة البشر على كتابة مطالبات أفضل. الأول هو تدريب النماذج المساعدة أو التمثيلات التفاضلية للموجه. والثاني هو تطبيق التلاعب المنفصل للمطالبات من خلال التعلم المعزز (RL) أو التعليقات المستندة إلى LLM.

كيف يعمل APO؟

يتبنى النهج المقترح أولاً دفعات صغيرة من بيانات التدريب للحصول على "التدرجات" في اللغة الطبيعية ، والتي تصف عيوب موجه معين. ثم يقوم بتحرير الموجه نحو الاتجاه الدلالي المعاكس للتدرج اللوني. تعمل هذه الخطوات كعنصر توسع في بحث شعاعي أوسع في مساحة المطالبات ، مما يجعل المهمة مشكلة اختيار مرشح الحزمة ، وبالتالي تحسين كفاءة الخوارزمية.

النتائج والتقييم

لتقييم فعالية APO ، قارنه فريق البحث في Microsoft بثلاثة خطوط أساسية للتعلم الفوري. تمت مقارنتها في مهام مختلفة في البرمجة اللغوية العصبية ، بما في ذلك الكشف عن كسر الحماية ، واكتشاف الكلام الذي يحض على الكراهية ، والكشف عن الأخبار المزيفة ، واكتشاف السخرية. أظهرت النتائج أن APO تفوق باستمرار على خطوط الأساس الأخرى ، وحقق تحسينات كبيرة على خطوط الأساس Monte Carlo (MC) والتعلم المعزز (RL) دون ضبط المعلمة الفائقة أو التدريب على النموذج.

أظهرت النتائج أن APO تفوق باستمرار على خطوط الأساس الأخرى دون ضبط المعامل الفائق.

تأثير APO

مع APO ، سيصبح تحسين الهندسة السريعة وتحسينها أكثر سهولة وفعالية حيث تصبح المطالبات معقدة ومعقدة بشكل متزايد. لدى APO القدرة على رفع كفاءة النماذج اللغوية الكبيرة وتقليل العمل اليدوي ووقت التطوير اللازمين للتطور السريع من خلال أتمتة عملية التحسين الفوري. يعد هذا تطورًا مهمًا لأنه يمكن أن يؤدي إلى أداء أفضل عبر مجموعة من مهام البرمجة اللغوية العصبية.

قلنا

سيكون لإدخال التحسين الفوري التلقائي (APO) بواسطة Microsoft AI Research تأثير كبير على تحسين الهندسة الفورية لـ LLMs. إطار العمل سهل الاستخدام ، والأغراض العامة ، وغير معلمي. هذا يجعلها أداة فعالة لتحسين الجودة الفورية دون ضبط إضافي للمعلمات الفائقة أو تدريب على النموذج. مع APO ، سيكون تحسين الهندسة السريعة أكثر سهولة وفعالية ودقة ، مما يؤدي إلى نتائج أفضل عبر مهام البرمجة اللغوية العصبية المختلفة.

ذكاء البيانات التوليدية

تقدم Microsoft إطار عمل التحسين الفوري التلقائي لـ LLMs

ما هو APO؟

كيف يعمل APO؟

النتائج والتقييم

تأثير APO

قلنا

مقالات ذات صلة

علامات قد يكون طفلك يستخدم الماريجوانا

تم الإعلان عن كل شيء في الاحتفال بالذكرى السنوية الثامنة لـ Dead By Daylight | TheXboxHub

أحدث المعلومات الاستخباراتية

رموز مشروع بولارو لشهر مايو 2024

حزمة Valorant Holomoku: تاريخ الإصدار المتوقع والمظاهر والمزيد

مخططات المبيعات في المملكة المتحدة: Indie Hit Sea of Stars يقتحم قائمة العشرة الأوائل الممتلئين بالطاغوت

رموز سباق الحيوانات لشهر مايو 2024

أرخص اللاعبين تقييمًا 87 في FC 24 Ultimate Team

شركة SteelSeries تكشف النقاب عن Arctis Nova 5 مع أكثر من 100 ملف صوتي خاص باللعبة | TheXboxHub