شعار زيفيرنت

الدراسة: تحسين إمكانية تفسير ميزات ML للمستخدمين النهائيين

التاريخ:

كثيرًا ما يتم وصف المقدار الذي تساهم به الميزات المحددة المستخدمة في النموذج في التنبؤ به في تقنيات التفسير التي تساعد المستهلكين على فهم نماذج التعلم الآلي والثقة بها. على سبيل المثال ، قد يكون الطبيب مهتمًا بمعرفة مدى تأثير بيانات معدل ضربات قلب المريض على نموذج يتنبأ بفرصة إصابة المريض بمرض قلبي.

ومع ذلك ، هل تساعد تقنية التفسير إذا كانت هذه الخصائص صعبة الفهم للمستخدم النهائي؟ إذا كنت مهتمًا بتطوير ML ، فتحقق يعود تاريخ التعلم الآلي إلى القرن السابع عشر.

جدول المحتويات

تم إنشاء تصنيف لتحسين إمكانية تفسير ميزات ML

لتسهيل استخدام صانعي القرار لنتائج خوارزميات التعلم الآلي ، يعمل باحثو معهد ماساتشوستس للتكنولوجيا على تقديم ميزات أكثر قابلية للتفسير. لقد أنشأوا تصنيفًا استنادًا إلى سنوات من العمل الميداني لمساعدة المطورين في إنشاء ميزات أبسط لفهم جمهورهم المستهدف.

"اكتشفنا أنه في العالم الواقعي ، على الرغم من أننا كنا نستخدم أحدث الطرق لشرح نماذج التعلم الآلي ، لا يزال هناك الكثير من الالتباس الناجم عن الميزات ، وليس من النموذج نفسه" ، كما يقول ألكسندرا زيتيك ، طالبة دكتوراه في الهندسة الكهربائية وعلوم الكمبيوتر ومؤلفة رئيسية لكتاب ورقة تقدم التصنيف.

تم إنشاء تصنيف لتحسين إمكانية تفسير ميزات Ml من قبل الباحثين لأننا نستخدم أحدث الطرق لشرح نماذج التعلم الآلي ، ولا يزال هناك الكثير من الالتباس الناجم عن الميزات.
يعمل باحثو معهد ماساتشوستس للتكنولوجيا على جعل الميزات أكثر قابلية للتفسير

حدد الباحثون الخصائص التي تتيح فهم الميزات من قبل خمسة أنواع مختلفة من المستخدمين - من متخصصي الذكاء الاصطناعي إلى أولئك الذين قد يتأثرون بتنبؤ نموذج التعلم الآلي - لإنشاء التصنيف. كما أنها توفر إرشادات حول كيفية قيام صانعي النماذج بتحويل الميزات إلى تنسيقات أبسط ليفهمها الأشخاص العاديون.

وهم يعتقدون أن دراستهم ستشجع مطوري النماذج على التفكير في دمج العناصر القابلة للتفسير في وقت مبكر بدلاً من محاولة الرجوع إلى الوراء والتركيز على القابلية للتفسير لاحقًا.

لور بيرتي-إيكيل ، أستاذ زائر في معهد ماساتشوستس للتكنولوجيا ومدير الأبحاث في IRD ، ودونجيو ليو ، باحث ما بعد الدكتوراة ، وكاليان فيراماتشاني ، عالم أبحاث رئيسي في مختبر نظم المعلومات واتخاذ القرار (LIDS) ورئيس قسم البيانات إلى الذكاء الاصطناعي. المجموعة ، هم المؤلفون المشاركون لبحوث معهد ماساتشوستس للتكنولوجيا. وانضم إليهم إجناسيو أرنالدو ، عالم البيانات الرئيسي في Corelight. الدراسة موجودة في النشرة الإخبارية للاستكشافات التي تمت مراجعتها من قبل النظراء ، طبعة يونيو من مجموعة الاهتمامات الخاصة بآلات الحوسبة حول اكتشاف المعرفة واستخراج البيانات.

خط الأساس للدراسة

تستخدم نماذج التعلم الآلي ميزات كمتغيرات إدخال ، غالبًا ما تكون مأخوذة من أعمدة مجموعة البيانات. وفقًا لـ Veeramachaneni ، غالبًا ما يختار علماء البيانات ميزات النموذج وينشئوها يدويًا لضمان إنشاء الخصائص لزيادة دقة النموذج بدلاً من قدرة صانع القرار على فهمها.

لقد عمل هو وفريقه مع صانعي القرار لمعالجة مشكلات قابلية استخدام التعلم الآلي لعدة سنوات. نظرًا لعدم فهمهم للخصائص التي تؤثر على التوقعات ، فإن هؤلاء الخبراء في المجال ، والذين يفتقر معظمهم إلى خبرة التعلم الآلي ، غالبًا ما يفتقرون إلى الثقة في النماذج.

تم إنشاء تصنيف لتحسين إمكانية تفسير ميزات Ml من قبل الباحثين لأننا نستخدم أحدث الطرق لشرح نماذج التعلم الآلي ، ولا يزال هناك الكثير من الالتباس الناجم عن الميزات.
إن حجر الزاوية في تصنيف الباحثين هو فكرة أن الحجم الواحد لا يناسب الجميع.

لقد تعاونوا في دراسة واحدة مع أطباء من وحدة العناية المركزة في مستشفى استخدموا التعلم الآلي للتنبؤ باحتمالية تعرض المريض لصعوبات بعد جراحة القلب. اتجاه معدل ضربات قلب المريض بمرور الوقت هو أحد الأمثلة على ميزة يتم عرضها كقيم مجمعة. على الرغم من أن الميزات المحددة بهذه الطريقة كانت "جاهزة للنموذج" (يمكن للنموذج تفسير البيانات) ، لم يعرف الأطباء كيفية حسابها. وفقًا لـ Liu ، فإنهم يفضلون ملاحظة كيفية اتصال هذه السمات المجمعة بالقياسات الأصلية لاكتشاف عدم انتظام معدل ضربات قلب المريض.

من ناحية أخرى ، قام فريق من العلماء المتعلمين بتقدير الصفات التي تم تجميعها. ويفضلون تجميع الميزات ذات الصلة وتصنيفها باستخدام الكلمات التي تعرفوا عليها ، مثل "مشاركة" ، بدلاً من امتلاك ميزة مثل "عدد المشاركات التي نشرها الطالب في منتديات المناقشة".

"مع القابلية للتفسير ، حجم واحد لا يناسب الجميع. عندما تذهب من منطقة إلى أخرى ، هناك احتياجات مختلفة. والتفسير بحد ذاته له العديد من المستويات "، أوضح فييراماتشاني.

إن حجر الزاوية في تصنيف الباحثين هو فكرة أن الحجم الواحد لا يناسب الجميع. يشرح بالتفصيل الخصائص التي من المحتمل أن تكون الأكثر أهمية لمستخدمين معينين وتحدد الخصائص التي يمكن أن تجعل الميزات قابلة للتفسير بشكل أو بآخر لمختلف صانعي القرار.

تم إنشاء تصنيف لتحسين إمكانية تفسير ميزات Ml من قبل الباحثين لأننا نستخدم أحدث الطرق لشرح نماذج التعلم الآلي ، ولا يزال هناك الكثير من الالتباس الناجم عن الميزات.
يقول التصنيف ، إذا كنت تقوم بعمل ميزات قابلة للتفسير ، إلى أي مستوى يمكن تفسيرها؟

على سبيل المثال ، قد يعطي مطورو التعلم الآلي الأولوية للمتغيرات التنبؤية والمتوافقة ، حيث من المتوقع أن تعمل هذه الميزات على تحسين أداء النموذج.

ومع ذلك ، قد يتم تلبية احتياجات صانعي القرار الذين ليس لديهم خبرة سابقة في التعلم الآلي بشكل أفضل من خلال الميزات التي يصاغها الإنسان ، أي أنها موصوفة بطريقة طبيعية للمستخدمين.

"التصنيف يقول ، إذا كنت تقدم ميزات قابلة للتفسير ، إلى أي مستوى يمكن تفسيرها؟ قال Zytek قد لا تحتاج إلى جميع المستويات ، اعتمادًا على نوع خبراء المجال الذين تعمل معهم.

إمكانية تفسير ميزات ML للمحترفين

لتسهيل فهم الميزات على جمهور معين ، يقدم الباحثون أيضًا استراتيجيات هندسة الميزات التي يمكن للمطورين استخدامها.

يستخدم علماء البيانات طرقًا مثل تجميع البيانات أو تطبيع القيم لتغيير البيانات خلال عملية هندسة الميزات بحيث يمكن لنماذج التعلم الآلي معالجتها. بالإضافة إلى ذلك ، لا تستطيع معظم النماذج التعامل مع المدخلات الفئوية دون تحويلها أولاً إلى رمز رقمي. في كثير من الأحيان ، يكاد يكون من المستحيل على الأشخاص العاديين كشف هذه التحولات.

قد يكون التراجع عن بعض هذا الترميز ضروريًا لإنتاج خصائص قابلة للتفسير ، وفقًا لـ Zytek. كتوضيح ، تقوم طريقة هندسة الميزات النموذجية بترتيب نطاقات البيانات بحيث يكون لها جميعًا نفس القدر من السنوات. لتسهيل فهم هذه الصفات ، يمكن للمرء تصنيف الفئات العمرية باستخدام المصطلحات البشرية ، مثل حديثي الولادة ، والأطفال الصغار ، والأطفال ، والمراهقين. أو ، كما يقول ليو ، يمكن أن تكون الميزة القابلة للتفسير هي بيانات معدل النبض الخام بدلاً من ميزة معالجة مثل متوسط ​​معدل النبض.

تم إنشاء تصنيف لتحسين إمكانية تفسير ميزات Ml من قبل الباحثين لأننا نستخدم أحدث الطرق لشرح نماذج التعلم الآلي ، ولا يزال هناك الكثير من الالتباس الناجم عن الميزات.
سيكون من الممكن تحسين إمكانية تفسير ميزات ML للجميع.

"في كثير من المجالات ، تكون المفاضلة بين الميزات القابلة للتفسير ودقة النموذج صغيرة جدًا في الواقع. عندما كنا نعمل مع مراقبي رعاية الأطفال ، على سبيل المثال ، قمنا بإعادة تدريب النموذج باستخدام الميزات التي تلبي تعريفاتنا لقابلية التفسير ، وكان انخفاض الأداء ضئيلًا تقريبًا "، أوضح Zytek.

بناءً على هذا البحث ، يقوم الباحثون بإنشاء نظام يمكّن مطور النموذج من إدارة تحويلات الميزات المعقدة بشكل أكثر فاعلية وتقديم تفسيرات لنماذج التعلم الآلي الموجهة نحو الأشخاص.

بالإضافة إلى ذلك ، سيقوم هذا النظام الجديد بترجمة الخوارزميات التي تم إنشاؤها لشرح مجموعات البيانات الجاهزة للنماذج إلى تنسيقات يمكن لصناع القرار فهمها. وبالتالي سيكون من الممكن تحسين إمكانية تفسير ميزات ML للجميع. تركز الصناعة على نماذج التعلم الآلي هذه. على سبيل المثال، ستكون طريقة تعلم الآلة الجديدة هي القوة الدافعة نحو تحسين الخوارزميات.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة

الدردشة معنا

أهلاً! كيف يمكنني مساعدك؟