نادرًا ما يتم نشر النماذج: فشل على مستوى الصناعة في قيادة التعلم الآلي

By إريك سيجل ، دكتوراه.، أسبوع التعلم الآلي

يؤكد أحدث استطلاع لـ KDnuggets ضجة الصناعة الرهيبة اليوم: عدد قليل جدًا من نماذج التعلم الآلي التي يتم نشرها بالفعل. في هذه المقالة ، سألخص نتائج الاستطلاع وأناقش أن هذا الفشل المتفشي لمشاريع ML يأتي من الافتقار إلى القيادة الحكيمة. سأجادل أيضًا أن MLops ليس العنصر الأساسي المفقود - بدلاً من ذلك ، يجب أن تكون ممارسة قيادة ML الفعالة هي الكلب الذي يهز ذيل تكامل النموذج.

بالنظر إلى الأحاديث المتزايدة حول فشل ML في الإطلاق ، كان هناك القليل نسبيًا من الأبحاث الصناعية الملموسة - خاصة عندما يتعلق الأمر بالمسوحات حول نشر النموذج على وجه الخصوص بدلاً من العائد على الاستثمار بشكل عام - لذلك اقترحت هذا الاستطلاع على Gregory Piatetsky و Matthew Mayo من KDnuggets. لقد ساعدوني في صياغتها وصياغتها.

النتائج قاتمة ، ولكن هناك ميل متفائل: في معظم الحالات ، العنصر الوحيد المفقود لتحقيق النشر الذي يدفع القيمة الحقيقية هو ممارسة القيادة الصحيحة - جنبًا إلى جنب مع بعض التكثيف البدائي للمسؤولين التنفيذيين. وهذا يعني أن الإثارة حول ML تستحقها. تكمن المشكلة في أن هذه الإثارة تركز حاليًا بشكل شبه كامل على التكنولوجيا الأساسية نفسها ، بدلاً من إطلاقها في الإنتاج.

سؤال الاستطلاع الأول: ما النسبة المئوية لنماذج التعلم الآلي (التي أنشأتها أنت أو زملاؤك بنية النشر) التي تم نشرها بالفعل؟

نادرًا ما يتم نشر النماذج: فشل على مستوى الصناعة في قيادة التعلم الآلي

يقول غالبية علماء البيانات أن 0 إلى 20 ٪ فقط من النماذج التي تم إنشاؤها ليتم نشرها قد وصلت إلى هناك. بمعنى آخر ، يقول معظمهم أن 80٪ أو أكثر من مشاريعهم تتعطل قبل نشر نموذج ML.

يتوافق معدل النجاح المنخفض بشكل مذهل مع أبحاث الصناعة السابقة. نرى مقال توماس دافنبورت وكاتي مالون للحصول على نظرة عامة جيدة التقديم لسجل الإنجاز ، والذي يتضمن نتائج من مسح Rexer Analytics لعلماء البيانات يوضح أنه ، قبل عدة سنوات ، قال 13٪ فقط إن نماذجهم يتم نشرها دائمًا (في استطلاع عام 2020 الأخير ، انخفض هذا إلى 11٪ ، كما أخبرني كارل ريكسر). يحذو المدراء حذوهم ، مشيرين إلى أن "10٪ فقط من الشركات تحصل على فوائد مالية كبيرة من تقنيات الذكاء الاصطناعي" ، وفقًا لـ بحث من MIT Sloan Management. محلل جارتنر واحد أيضًا مقدر أن ما يقرب من 85٪ من مشاريع البيانات الضخمة تفشل. بالإضافة إلى ذلك ، "متوسط العائد على جميع استثمارات الذكاء الاصطناعي حسب الشركة هو 1.3٪ فقط" و "20٪ فقط من مشاريع الذكاء الاصطناعي منتشرة على نطاق واسع" ، وفقًا لـ مسح عام 2020 لكبار المديرين التنفيذيين بواسطة ESI ThoughtLab.

قيادة ML للإنقاذ

إليكم جذر المشكلة: نحن نصنع أساليب تعلم الآلة الأساسية التي تولد النماذج بدلاً من الشيء الذي يجب أن نكون أكثر حماسًا بشأنه - في الواقع باستخدام تلك النماذج في هذا المجال. إذا أردنا حقًا إعطاء الأولوية لنشر النموذج ، فسنقود بقوة في هذا الاتجاه من خلال التخطيط الصارم له من البداية ، قبل أن يبدأ أي عمل عملي.

اسمحوا لي بعبارة أخرى. الضجيج السائد اليوم حول قدرة تحطيم الأرقام نفسها - مع تركيز ضئيل نسبيًا على تحقيق الانتشار - يشبه أن تكون أكثر حماسًا لبناء صاروخ من إطلاقه.

الدافع وراء عالم البيانات هو "المضي قدمًا" في النمذجة في أسرع وقت ممكن. ينطبق هذا أيضًا على الوافدين الجدد ، الذين يقفزون بشكل حصري تقريبًا إلى الدورات التدريبية العملية والكتب التي تفترض أن بيانات التدريب قد تم إعدادها بالفعل. يشكل هذا سردًا خاطئًا بشكل صارخ حيث تتمثل الخطوة الأولى لمشروع ML في تحميل البيانات في برنامج النمذجة.

هذا الافتراض الخاطئ ، أن البيانات موجودة بالفعل ، هو أحد الأعراض الصارخة لمتلازمة "فقدان النقطة" الجماعية في صناعة غسل الأموال. إنه يكشف عن أننا لا ندرب الممارسين على الكرة: النشر. بعد كل شيء ، حتى قبل أن تتمكن من البدء في إعداد البيانات ، فإن متطلباتها - وعلى الأخص تعريف المتغير التابع - تعتمد بشكل كبير على مشروع جيد النطاق ومستنير واجتماعي وفي النهاية مصمم لتحقيق النشر. النشر يعني تغيير جذري للعمليات الحالية. لا يمكنك أن تفترض أن صانعي القرار سيقبلون بسهولة. فالتعاون العميق معهم يعد أكثر أهمية من إنشاء نموذج.

التعلم العميق ، بكل ما يحمله من وعود وأهمية ، لا يؤدي إلا إلى تضخيم المشكلة ، وزيادة نسبة الضجيج إلى القيمة المحققة. من المرجح أن تكون مثل هذه المشاريع تخمينية واستكشافية - أكثر في جانب البحث والتطوير بمسافة أوسع لاجتيازها قبل أي احتمال نهائي للنشر. غالبًا ما تقدم مشاريع التعلم العميق عمليات وإمكانيات جديدة ، مثل نماذج معالجة الصور التي تقترح التشخيصات للأطباء أو قيادة المركبات الذاتية. يتناقض هذا مع تطبيقات الأعمال الأكثر رسوخًا لما هي عادةً طرق نمذجة أبسط ، والتي تعمل فقط على تعزيز العمليات الحالية ، مثل اكتشاف الاحتيال وتسجيل الائتمان. علاوة على ذلك ، فإن تعقيد نماذج التعلم العميق يعني أيضًا أن تحديات التكامل من المرجح أن يتم التقليل من شأنها وليس التخطيط لها بشكل كافٍ.

ضجيج "الذكاء الاصطناعي" يحرف التركيز عن النشر العملي الأكثر شهرة. عندما تنتقل إلى السعي وراء "الذكاء" ، فإنك تتوقف عن حل مشكلة معينة بالدرجات التنبؤية. بدلاً من ذلك ، أنت تلاحق مغالطة. الذكاء هدف لا يمكن تحديده بطريقة هادفة في سياق الهندسة. انظر كتاب ريتشارد هايمان الجديد ، القيام بالذكاء الاصطناعي، الأمر الذي يفضح السرد الكاذب للذكاء الاصطناعي: ادعاءه أنه - أو على الأقل قريبًا - الحل النهائي الذي يناسب الجميع ، رصاصة فضية قادرة على حل جميع المشكلات. ولمزيد من المعلومات حول هذا ، لقد صنعت سلسلة قصيرة من مقاطع الفيديو حول سبب تكبد إضفاء الشرعية على الذكاء الاصطناعي كحقل تكلفة كبيرة للأعمال.

ممارسة القيادة الصحيحة لتعلم الآلة تجسر فجوة أكبر مما يدركه معظم الناس. إنه يشكل مسارًا قابلاً للتطبيق للنشر ، والذي يتضمن تحقيق المشاركة من قادة الأعمال الرئيسيين - الذين غالبًا ما يقدمون مدخلات تغير المفهوم الأصلي لعالم البيانات للمشروع. دون المشاركة بشكل استباقي ، سيقف هؤلاء الأشخاص عادةً في طريق النشر.

لمزيد من التعمق ، راجع مقالاتي عن قيادة ML في KD nuggets, هارفارد بيزنس ريفيوو مجلة التحليلات (INFORMS)، بالإضافة إلى دورة تعلم الآلة عبر الإنترنت (شاهد الفيديو على لماذا يحتاج علماء البيانات إلى تعلم الجانب التجاري من ML) ومسار مؤتمر التشغيل أسبوع التعلم الآلي. بالحديث عن ذلك ، فإن مضيف مسار المؤتمر ، المستشار جيمس تايلور ، هو سلطة رائدة في هذا المجال. لقد نشر العديد من المقالات حول هذا الموضوع ، مثل واحد في أساسيات تفعيل ML واحد على لماذا تكافح المنظمات من أجل أن تصبح مدفوعة بالبيانات.

المشاكل الناجمة عن عدم وجود قيادة ML

كشف سؤال الاستطلاع الثاني عن أنواع المشاكل التي تقف في طريق الانتشار.

سؤال الاستطلاع الثاني: من واقع خبرتك ، ما هو العائق الرئيسي أمام نشر النموذج؟

نادرًا ما يتم نشر النماذج: فشل على مستوى الصناعة في قيادة التعلم الآلي

إن الافتقار إلى القيادة هو الذي يعيق الانتشار في أغلب الأحيان. من بين الاستجابات الثلاثة الأولى ، والتي تشكل مجتمعة 91٪ ، لم يشر سوى واحد فقط إلى فشل محتمل في النمذجة بدلاً من فشل في تخطيط المشروع: "الأداء لا يعتبر قوياً بما فيه الكفاية من قبل صانعي القرار". ومع ذلك ، يمكنك المراهنة على أن هذا غالبًا ما ينبع من الإدارة السيئة لتوقعات المشرفين حول ما إذا كانت النماذج ستكون "دقيقة للغاية" (لن يكون معظمهم) وما إذا كانت النماذج الأكثر واقعية ستكون ذات قيمة إذا تم نشرها مع ذلك (سيكون معظمها كذلك). يجب على قيادة غسل الأموال تكثيف صانعي القرار وفقًا لذلك.

تحديات الاندماج (35٪) تعكس في الواقع فشل قيادة بدلاً من فشل التكنولوجيا أو نقص MLops ، في معظم الحالات. بعد كل شيء ، مع نشر الهدف المحدد منذ بداية مشروع ML ، يجب أن يكون تقييم متطلبات التكامل الفني - والتخطيط لتحقيقها - مساويًا في الأولوية للنمذجة نفسها. قد يكون MLops جزءًا أساسيًا من هذا الإنجاز ، لكنه ليس علاجًا للنشر. عادةً ما يكون أكبر عنق الزجاجة للنشر هو الحصول على دعم من صانعي القرار البشريين ، حتى لو كانت تحديات التكامل مثيرة للإعجاب أيضًا. على أي حال ، فإن القيادة هي الأساس الذي يعالج جميع العقبات ، في حين أن MLops ليست سوى واحدة من العديد من الأدوات المتاحة للقيادة. إذا اتضح أن MLops هو المكون الرئيسي المفقود ، فذلك بسبب فشل القيادة ، وليس حجة أن MLops هو الحل الوحيد لمشاكل النشر لدينا بشكل عام.

يمكن أن تنبع مشكلات "الخصوصية / القانونية" الأقل مرتبة أيضًا من الافتقار إلى التبصر والتخطيط - على الرغم من أن مثل هذه المشكلات يمكن أن تظهر بشكل غير متوقع. نظرًا للأهمية الكبيرة والاهتمام الواسع النطاق الممنوح لهذه الأمور ، فمن الملاحظ أنها لا يتم تصنيفها في كثير من الأحيان على أنها العائق الرئيسي. من المحتمل أن مشاريع ML ببساطة لا تصل إلى ما يكفي لمواجهة هذه المشكلات ، وتتوقف في وقت سابق بسبب المشكلات الأخرى.

الخطوات التالية

هناك حاجة إلى مزيد من البحوث الصناعية. هذا الاستطلاع القصير يترك الكثير من عدم اليقين والكثير لاستطلاع الرأي. بعد كل شيء ، من المرجح أن تنجح بعض مشاريع تعلم الآلة الحثيثة - مثل تدريب نموذج محدث لنظام تصنيف الائتمان الحالي في بنك كبير - أكثر من المبادرات الجديدة. من الناحية المثالية ، ستتميز الاستطلاعات المستقبلية حسب مجال التطبيق ، وقطاع الصناعة ، وما إذا كانت المبادرة جديدة ، وما إذا كانت تستخدم التعلم العميق. قد نجد ، خارج أفضل الظروف ، أن معدل الفشل أعلى من ذلك.

لكني سأختتم بعبارة أكثر أهمية للحث على اتخاذ إجراء: قيادة ML جيدًا. تولى قيادة مشاريع ML نحو النشر بنفس الدقة التي تتعامل بها مع تطبيق خوارزميات ML الأساسية!

إريك سيجل ، دكتوراه ، هو مستشار بارز وأستاذ سابق في جامعة كولومبيا يعمل على ربط الجوانب التجارية والتقنية في التعلم الآلي. هو مؤسس عالم التحليلات التنبؤية و عالم التعلم العميق سلسلة المؤتمرات معًا أسبوع التعلم الآلي، والتي خدمت أكثر من 17,000 مشارك منذ عام 2009. كمدرس للدورة التدريبية الشهيرة عبر الإنترنت "قيادة وممارسة تعلم الآلة - إتقان شامل"، الحائز على جوائز التدريس كأستاذ ومتحدث شهير ، ألقى إريك أكثر من 110 عنوان رئيسي. المحرر التنفيذي لموقع أوقات التعلم الآليكتب الأكثر مبيعًا التحليلات التنبؤية: القدرة على التنبؤ بمن سينقر أو يشتري أو يكذب أو يموتالذي تم اعتماده للدورات في مئات الجامعات. ظهر إريك في العديد من القنوات الإعلامية ، بما في ذلك بلومبرغ, ناشيونال جيوغرافيكو الإذاعة الوطنية العامة، وقد نشر في نيوزويك, HBR, مدونة SciAm, وايبو, WSJ, و الأكثر من ذلك - بما في ذلك مقالات الرأي حول التحليلات والعدالة الاجتماعية. اتبعه تضمين التغريدة.

المصدر: https://www.kdnuggets.com/2022/01/models-rarely-deployed-industry-failure-machine-learning-leadership.html

ذكاء البيانات التوليدية

نادرًا ما يتم نشر النماذج: فشل على مستوى الصناعة في قيادة التعلم الآلي

قيادة ML للإنقاذ

المشاكل الناجمة عن عدم وجود قيادة ML

المزيد من الدلائل على أزمة انتشار غسل الأموال

الخطوات التالية

ارفع مستوى نومك في يوم الصحة العالمي هذا مع LAC

لا تتعلق الجلسة التشريعية لعام 2024 في نورث كارولاينا بالميزانية فحسب - اتصال برنامج الماريجوانا الطبية

أحدث المعلومات الاستخباراتية

تم اختيار GA-ASI لبناء CCA لـ AFLCMC

إليكم الشركتان اللتان تصنعان طائرات بدون طيار للقوات الجوية الأمريكية

أرباح فورد للربع الأول تتخطى التوقعات، وترى أن أرباح العام بأكمله "تصل إلى أعلى المستويات" - Autoblog

ستقوم شركة تشغيل المطار أفينور بتأسيس النرويج كساحة اختبار دولية للطيران عديم الانبعاثات ومنخفض الانبعاثات

يعود رايان هيرلي إلى مجموعة Rose Law Group كرئيس لقسم القنب

المستخدمون منبهرون بأداة تحويل الصور إلى فيديو من Microsoft - VASA-

الدردشة معنا