شعار زيفيرنت

استطلاع: لا تزال مشاريع التعلم الآلي تفشل بشكل روتيني في النشر - KDnuggets

التاريخ:

كم مرة تصل مشاريع التعلم الآلي إلى النشر الناجح؟ ليس في كثير من الأحيان بما فيه الكفاية. هناك وفرة of العالمية بحث تبين عادةً ما تفشل مشاريع تعلم الآلة في تحقيق عوائد، لكن قليلين هم من قاموا بقياس نسبة الفشل إلى النجاح من وجهة نظر علماء البيانات - الأشخاص الذين يطورون النماذج ذاتها التي تهدف هذه المشاريع إلى نشرها.

متابعة على مسح عالم البيانات التي أجريتها مع KDnuggets العام الماضي، استبيان علوم البيانات الرائد في الصناعة لهذا العام لقد تناولت شركة Rexer Analytics التي تديرها شركة Rexer Analytics الاستشارية لتعلم الآلة هذا السؤال - ويرجع ذلك جزئيًا إلى أن كارل Rexer، مؤسس الشركة ورئيسها، سمح لك بالمشاركة الحقيقية، مما دفع إلى إدراج أسئلة حول نجاح النشر (جزء من عملي خلال فترة أستاذية في التحليلات لمدة عام واحد) في أوفا داردن).

الأخبار ليست رائعة. يقول 22% فقط من علماء البيانات أن مبادراتهم "الثورية" - النماذج التي تم تطويرها لتمكين عملية أو قدرة جديدة - يتم نشرها عادةً. 43% يقولون أن 80% أو أكثر يفشلون في الانتشار.

عبر من جميع أنواع مشاريع تعلم الآلة - بما في ذلك النماذج المحدثة لعمليات النشر الحالية - يقول 32% فقط أن نماذجهم يتم نشرها عادةً.

فيما يلي النتائج التفصيلية لهذا الجزء من الاستطلاع، كما قدمتها Rexer Analytics، والتي تقسم معدلات النشر عبر ثلاثة أنواع من مبادرات تعلم الآلة:
 

استطلاع: لا تزال مشاريع التعلم الآلي تفشل بشكل روتيني في النشر
 

مفتاح:

  • المبادرات القائمة: النماذج التي تم تطويرها لتحديث/تحديث نموذج موجود تم نشره بالفعل بنجاح
  • مبادرات جديدة: النماذج التي تم تطويرها لتعزيز العملية الحالية التي لم يتم نشر أي نموذج لها بالفعل
  • المبادرات الثورية: النماذج التي تم تطويرها لتمكين عملية أو قدرة جديدة

من وجهة نظري، ينبع هذا النضال من أجل النشر من عاملين رئيسيين مساهمين: سوء التخطيط المستوطن وافتقار أصحاب المصلحة في الأعمال إلى رؤية ملموسة. لم يدرك العديد من متخصصي البيانات وقادة الأعمال أن التشغيل المقصود لتعلم الآلة يجب التخطيط له بتفصيل كبير ومتابعته بقوة منذ بداية كل مشروع تعلم الآلة.

في الواقع، لقد قمت بتأليف كتاب جديد حول هذا الموضوع: دليل الذكاء الاصطناعي: إتقان الفن النادر لنشر التعلم الآلي. في هذا الكتاب، أقدم ممارسة مكونة من ست خطوات تركز على النشر لتوجيه مشاريع التعلم الآلي من الفكرة إلى النشر، وهو ما أسميه com.bizML (اطلب مسبقًا الغلاف الورقي أو الكتاب الإلكتروني و احصل على نسخة متقدمة مجانية من نسخة الكتاب المسموع فورا).

يحتاج صاحب المصلحة الرئيسي في مشروع تعلم الآلة - الشخص المسؤول عن الفعالية التشغيلية المستهدفة للتحسين، مثل مدير خط الأعمال - إلى رؤية دقيقة لكيفية تحسين تعلم الآلة لعملياته ومقدار القيمة التي من المتوقع أن يحققها التحسين. إنهم بحاجة إلى ذلك لإعطاء الضوء الأخضر في نهاية المطاف لنشر النموذج، وكذلك، قبل ذلك، للتأثير على تنفيذ المشروع طوال مراحل ما قبل النشر.

لكن أداء تعلم الآلة لا يتم قياسه في كثير من الأحيان! عندما طرح استطلاع Rexer السؤال التالي: "كم مرة تقوم شركتك/مؤسستك بقياس أداء المشاريع التحليلية؟" 48% فقط من علماء البيانات قالوا "دائمًا" أو "معظم الوقت". هذا جامح جدًا. ينبغي أن يكون أكثر من 99٪ أو 100٪.

وعندما يتم قياس الأداء، يكون ذلك من خلال مقاييس فنية غامضة وغير ذات صلة في الغالب بأصحاب المصلحة في الأعمال. يعرف علماء البيانات بشكل أفضل، لكنهم لا يلتزمون بها بشكل عام - ويرجع ذلك جزئيًا إلى أن أدوات تعلم الآلة لا تخدم عمومًا سوى المقاييس الفنية. وفقًا للاستطلاع، يقوم علماء البيانات بتصنيف مؤشرات الأداء الرئيسية للأعمال مثل عائد الاستثمار والإيرادات باعتبارها المقاييس الأكثر أهمية، ومع ذلك فإنهم يدرجون المقاييس الفنية مثل الرفع والمساحة تحت الطلب باعتبارها المقاييس الأكثر شيوعًا.

مقاييس الأداء الفني "عديمة الفائدة بشكل أساسي ومنفصلة عن أصحاب المصلحة في الأعمال"، وفقًا لما ذكره مراجعة علوم البيانات بجامعة هارفارد. وإليك السبب: يقولون لك فقط نسبي أداء النموذج، مثل كيفية مقارنته بالتخمين أو بخط أساس آخر. تخبرك مقاييس الأعمال مطلق قيمة الأعمال التي من المتوقع أن يقدمها النموذج - أو، عند التقييم بعد النشر، التي أثبت نجاحها. تعتبر هذه المقاييس ضرورية لمشاريع تعلم الآلة التي تركز على النشر.

إلى جانب الوصول إلى مقاييس الأعمال، يحتاج أصحاب المصلحة في الأعمال أيضًا إلى تكثيف جهودهم. عندما سأل استطلاع Rexer، "هل المديرون وصناع القرار في مؤسستك الذين يجب عليهم الموافقة على نشر النموذج لديهم المعرفة الكافية بشكل عام لاتخاذ مثل هذه القرارات بطريقة مستنيرة؟" أجاب 49% فقط من المشاركين بـ "معظم الوقت" أو "دائمًا".

هذا ما أعتقد أنه يحدث. غالبًا ما يشعر "عميل" عالم البيانات، صاحب المصلحة في الأعمال، بالتردد عندما يتعلق الأمر بالترخيص بالنشر، حيث أن ذلك يعني إجراء تغيير تشغيلي كبير في خبز الشركة، وهي عملياتها الأكبر حجمًا. ليس لديهم الإطار السياقي. على سبيل المثال، يتساءلون: "كيف لي أن أفهم إلى أي مدى سيساعد هذا النموذج، الذي يؤدي أداءً بعيدًا عن الكمال الكروي، في الواقع؟" وهكذا يموت المشروع. بعد ذلك، فإن وضع نوع من اللمسة الإيجابية بشكل إبداعي على "الأفكار المكتسبة" يعمل على إخفاء الفشل تحت السجادة. يظل الضجيج حول الذكاء الاصطناعي سليمًا حتى في حالة فقدان القيمة المحتملة، والغرض من المشروع.

حول هذا الموضوع - تكثيف أصحاب المصلحة - سأقوم بنشر كتابي الجديد، كتاب اللعب لمنظمة العفو الدولية، مرة أخرى فقط. أثناء تغطية ممارسة bizML، يعمل الكتاب أيضًا على تحسين مهارات محترفي الأعمال من خلال تقديم جرعة حيوية ولكن ودية من المعرفة الأساسية شبه التقنية التي يحتاجها جميع أصحاب المصلحة من أجل القيادة أو المشاركة في مشاريع التعلم الآلي، من البداية إلى النهاية. وهذا يضع محترفي الأعمال والبيانات على نفس الصفحة حتى يتمكنوا من التعاون بعمق، وبشكل مشترك بدقة ما الذي يُطلب من التعلم الآلي التنبؤ به، ومدى جودة التنبؤ، وكيف يتم التعامل مع تنبؤاته لتحسين العمليات. هذه الأساسيات تؤدي إلى نجاح كل مبادرة أو فشلها - إن الحصول عليها بشكل صحيح يمهد الطريق لنشر التعلم الآلي القائم على القيمة.

من الآمن أن نقول إن الأمر صعب، خاصة بالنسبة لمبادرات تعلم الآلة الجديدة التي تتم تجربتها لأول مرة. نظرًا لأن القوة المطلقة لضجيج الذكاء الاصطناعي تفقد قدرتها على التعويض باستمرار

قيمة محققة أقل من الموعودة، سيكون هناك المزيد والمزيد من الضغط لإثبات القيمة التشغيلية لتعلم الآلة. لذلك أقول، استبق هذا الأمر الآن - ابدأ في غرس ثقافة أكثر فعالية للتعاون بين المؤسسات وقيادة المشاريع الموجهة نحو النشر!

للحصول على نتائج أكثر تفصيلاً من استبيان علوم بيانات Rexer Analytics لعام 2023، اضغط هنا هنا. هذا هو أكبر استطلاع لمتخصصي علوم البيانات والتحليلات في الصناعة. يتكون من ما يقرب من 35 سؤالًا متعدد الاختيارات ومفتوح النهاية يغطي أكثر بكثير من مجرد معدلات نجاح النشر - سبعة مجالات عامة لعلم وممارسة استخراج البيانات: (1) المجال والأهداف، (2) الخوارزميات، (3) النماذج، ( 4) الأدوات (حزم البرمجيات المستخدمة)، (5) التكنولوجيا، (6) التحديات، و(7) المستقبل. يتم إجراؤه كخدمة (بدون رعاية الشركات) لمجتمع علوم البيانات، وعادةً ما يتم الإعلان عن النتائج على مؤتمر أسبوع التعلم الآلي ومشاركتها عبر التقارير الموجزة المتاحة مجانًا.
 

هذا المقال هو نتاج عمل المؤلف عندما كان يشغل منصب أستاذ الذكرى المئوية الثانية للتحليلات في كلية UVA Darden للأعمال لمدة عام واحد، والذي توج في النهاية بنشر دليل الذكاء الاصطناعي: إتقان الفن النادر لنشر التعلم الآلي (عرض الكتب الصوتية المجانية).

 
 

اريك سيجل، دكتوراه، هو مستشار رائد وأستاذ سابق في جامعة كولومبيا الذي يجعل التعلم الآلي مفهومًا وآسرًا. وهو مؤسس عالم التحليلات التنبؤية و عالم التعلم العميق سلسلة المؤتمرات التي خدمت أكثر من 17,000 مشارك منذ عام 2009، مدرب الدورة المشهورة قيادة وممارسة تعلم الآلة - إتقان شامل، وهو متحدث شهير تم تكليفه أكثر من 100 عنوان رئيسي، والمحرر التنفيذي لـ أوقات التعلم الآلي. قام بتأليف الكتب الأكثر مبيعًا التحليلات التنبؤية: القدرة على التنبؤ بمن سينقر أو يشتري أو يكذب أو يموت، والذي تم استخدامه في دورات في أكثر من 35 جامعة ، وحصل على جوائز تدريسية عندما كان أستاذاً في جامعة كولومبيا ، حيث غنى اغاني تعليمية لطلابه. ينشر إريك أيضًا مقالات الرأي حول التحليلات والعدالة الاجتماعية. اتبعه في تضمين التغريدة.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة