شعار زيفيرنت

فهم تقنيات التعلم الآلي المختلفة

التاريخ:

هل التعلم المعزز خاضع للإشراف أم غير خاضع للإشراف؟ على الرغم من أهمية هذا السؤال الفني، فلنحول تركيزنا إلى منظور الأعمال. يحمل التعلم المعزز (RL) إمكانات هائلة لتحويل عمليات صنع القرار وتحسين الاستراتيجيات عبر الصناعات.

قد يكون الحجم الهائل للبيانات التي تنتجها أجهزة الكمبيوتر، والهواتف الذكية، والعديد من التقنيات، أمرًا شاقًا، وخاصة بالنسبة لأولئك غير المؤكدين بشأن الآثار المترتبة عليها. لتسخير هذه البيانات بشكل فعال، يستخدم الباحثون والمبرمجون في كثير من الأحيان التعلم الآلي لتعزيز تجارب المستخدم.

تظهر يوميًا منهجيات متطورة لعلماء البيانات تشمل تقنيات التعلم الخاضعة للإشراف وغير الخاضعة للإشراف والمعززة. تهدف هذه المقالة إلى وصف التعلم الخاضع للإشراف وغير الخاضع للإشراف والتعليم المعزز بإيجاز، وتسليط الضوء على الفروق بينهما، وتوضيح تطبيقاتها من قبل الشركات البارزة.

هل التعلم المعزز خاضع للإشراف أم غير خاضع للإشراف؟

التعلم المعزز يشق طريقه الخاص في عالم آلة التعلم، يختلف عن كل من التعلم الخاضع للإشراف وغير الخاضع للإشراف. لكن دعونا نتعرف أولاً على ما يتم التعلم تحت الإشراف والتعلم غير الخاضع للإشراف أولاً.

ما هو التعلم تحت الإشراف؟

التعلم الخاضع للإشراف هو أسلوب للتعلم الآلي حيث يتم تدريب النموذج على مجموعة بيانات مصنفة. وهذا يعني أن البيانات تتضمن أمثلة المدخلات والمخرجات المطلوبة (التسميات) المقابلة لها. الهدف هو أن يتعلم النموذج العلاقة بين المدخلات والمخرجات، حتى يتمكن من التنبؤ بدقة بمخرجات البيانات الجديدة غير المرئية.

فكر في الأمر مثل تعلم الطالب مع المعلم. تشبه مجموعة البيانات المسماة مسائل الممارسة مع الحلول. يدرس الطالب (النموذج) هذه الأمثلة ويقوم المعلم (الخوارزمية) بتوجيه عملية التعلم. الهدف هو أن يتعلم الطالب كيفية حل المشكلات المماثلة بشكل مستقل.

المفاهيم الرئيسية:

  • البيانات الموسومة: قلب التعلم تحت الإشراف. تحتوي كل نقطة بيانات على مدخل (ميزات) ومخرجاتها الصحيحة المقابلة (التسمية).
  • تدريب: يتم تغذية النموذج بالبيانات المسمى. ويحلل الأنماط والعلاقات المتبادلة بين المدخلات والمخرجات.
  • وظيفة التعلم: يقوم النموذج بتطوير دالة رياضية تقوم بتعيين المدخلات إلى المخرجات بأكبر قدر ممكن من الدقة.
  • التنبؤ: بمجرد تدريب النموذج، يمكنه أخذ مدخلات جديدة والتنبؤ بمخرجاتها المقابلة.
هل التعلم المعزز خاضع للإشراف أم غير خاضع للإشراف؟
التعلم الخاضع للإشراف هو أسلوب للتعلم الآلي حيث يتم تدريب النموذج على مجموعة بيانات مصنفة

ما هو التعلم غير الخاضع للرقابة؟

التعلم غير الخاضع للرقابة هو أسلوب للتعلم الآلي حيث يتم تدريب النموذج على مجموعة بيانات غير مسماة. وهذا يعني أن البيانات تتضمن المدخلات فقط، دون أي مخرجات مستهدفة مقابلة. الهدف هو أن يكتشف النموذج الأنماط أو الهياكل أو العلاقات المخفية داخل البيانات نفسها.

فكر في الأمر كطفل يستكشف بيئة جديدة دون أي تعليمات محددة. يتعلم الطفل من خلال ملاحظة الأنماط، وتجميع الأشياء المتشابهة، وفهم العلاقات دون أن يخبره أحد بشكل مباشر بمسميات الأشياء.

المفاهيم الرئيسية:

  • البيانات غير المسماة: لا يحتوي التعلم غير الخاضع للرقابة على إجابات محددة مسبقًا للتعلم منها.
  • اكتشاف النمط: يقوم النموذج بتحليل البيانات للعثور على أوجه التشابه والاختلاف والهياكل الأساسية.
  • لا يوجد توجيه واضح: لا يوجد "معلم" يصحح النموذج. ويتعلم من خلال اكتشاف الذات.
هل التعلم المعزز خاضع للإشراف أم غير خاضع للإشراف؟
التعلم غير الخاضع للرقابة هو أسلوب للتعلم الآلي حيث يتم تدريب النموذج على مجموعة بيانات غير مسماة

ما هو التعلم المعزز؟

التعلم المعزز هو نوع من التعلم الآلي حيث يتعلم الوكيل من خلال التجربة والخطأ من خلال التفاعل مع البيئة. يحاول الوكيل تنفيذ إجراءات مختلفة، ويتلقى مكافآت أو عقوبات بناءً على أفعاله، ويقوم بتعديل إستراتيجيته لتعظيم إجمالي المكافأة بمرور الوقت.

تخيل تدريب كلب. لا تخبر الكلب صراحةً كيف يجلس. بدلًا من ذلك، فإنك تمنحه المكافآت عندما يقوم بأفعال تؤدي إلى الجلوس. مع مرور الوقت، يتعلم الكلب ربط الجلوس بالمكافآت

المفاهيم الرئيسية:

  • وكيل: صانع القرار، الكيان الذي يتعلم.
  • بيئة: النظام الذي يتفاعل معه الوكيل.
  • حالة: الوضع الحالي للوكيل داخل بيئته.
  • الإجراءات: ما يمكن أن يفعله الوكيل في بيئته.
  • المكافآت: إشارات ردود الفعل الإيجابية أو السلبية التي يتلقاها الوكيل مقابل أفعاله.
  • سياسة: الإستراتيجية التي يستخدمها الوكيل لتحديد الإجراء الذي يجب اتخاذه في حالة معينة.
هل التعلم المعزز خاضع للإشراف أم غير خاضع للإشراف؟
التعلم المعزز هو نوع من التعلم الآلي حيث يتعلم الوكيل من خلال التجربة والخطأ من خلال التفاعل مع البيئة

ما هي تقنية التعلم الآلي التي تختارها؟

لا توجد تقنية "أفضل" للتعلم الآلي تتفوق عالميًا على جميع التقنيات الأخرى. تعتمد أفضل تقنية بشكل كامل على هذه العوامل:

  • المشكلة: ما هي المهمة التي تحاول حلها؟
    • التصنيف (على سبيل المثال، تصفية البريد الإلكتروني العشوائي)؟
    • الانحدار (على سبيل المثال، التنبؤ بأسعار المساكن)؟
    • التجميع (على سبيل المثال، تجميع العملاء)
    • اكتشاف الحالات الشاذة (على سبيل المثال، تحديد المعاملات الاحتيالية)؟
  • نوع البيانات:
    • هل بياناتك مصنفة أم غير مصنفة؟
    • ما هو حجم مجموعة البيانات الخاصة بك؟
    • هل البيانات منظمة (مثل الأرقام والفئات) أم غير منظمة (مثل الصور والنص)؟
  • الأداء المطلوب:
    • هل تعطي الأولوية للسرعة أو الدقة العالية؟
    • ما مدى أهمية أن يكون النموذج قابلاً للتفسير بسهولة (فهم كيفية اتخاذ القرارات)؟

اختر التعلم الخاضع للإشراف إذا كان لديك مجموعة بيانات تحتوي على أمثلة مصنفة (بيانات الإدخال والمخرجات الصحيحة المقابلة لها). تشمل التقنيات الشائعة الانحدار الخطي (للتنبؤ بالقيم المستمرة)، والانحدار اللوجستي (للتصنيف)، وأشجار القرار (لإنشاء نماذج قائمة على القواعد)، وSVMs (لإيجاد الحدود بين فئات البيانات)، والشبكات العصبية (للتعرف على الأنماط المعقدة).

يعد التعلم غير الخاضع للرقابة مثاليًا لاستكشاف مجموعة البيانات الخاصة بك، أو الكشف عن الأنماط المخفية، أو تجميع نقاط بيانات مماثلة عندما لا يكون لديك نتيجة محددة مسبقًا في الاعتبار. تشمل التقنيات الشائعة K-Means Clustering (تجميع البيانات حسب التشابه)، وتحليل المكونات الرئيسية (PCA) (تقليل تعقيد البيانات)، وأجهزة التشفير التلقائي (للعثور على تمثيلات مدمجة للبيانات).

يعد التعلم المعزز مفيدًا بشكل خاص للمشكلات التي تركز على اتخاذ القرار مع المكافآت طويلة المدى، كما هو الحال في الألعاب أو الروبوتات. في التعلم المعزز، يتفاعل الوكيل مع البيئة، ويحصل على ردود فعل في شكل مكافآت أو عقوبات، ويتعلم الإستراتيجية المثلى لتعظيم المكافآت بمرور الوقت.


صورة ائتمانات: كيريم غولن / ميدجورني

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة