شعار زيفيرنت

هل تستطيع إدارة البيانات معالجة إرهاق الذكاء الاصطناعي؟ - كي دي ناجتس

التاريخ:

هل تستطيع إدارة البيانات معالجة إرهاق الذكاء الاصطناعي؟
صورة المؤلف
 

تبدو إدارة البيانات وإرهاق الذكاء الاصطناعي مفهومين مختلفين، ولكن هناك علاقة جوهرية بينهما. لفهم ذلك بشكل أفضل، لنبدأ بتعريفهم. 

لقد كان التركيز الأساسي لصناعة البيانات لفترة طويلة.

شراء مراجعات جوجل يوضح ذلك جيدًا - "حوكمة البيانات هي كل ما تفعله للتأكد من أن البيانات آمنة وخاصة ودقيقة ومتاحة وقابلة للاستخدام. فهو يتضمن وضع معايير داخلية - سياسات البيانات - التي تنطبق على كيفية جمع البيانات وتخزينها ومعالجتها والتخلص منها.

وكما يبرز هذا التعريف، فإن حوكمة البيانات تدور حول إدارة البيانات - وهي على وجه التحديد المحرك الذي يحرك نماذج الذكاء الاصطناعي.

الآن بعد أن بدأت العلامات الأولى للارتباط بين إدارة البيانات والذكاء الاصطناعي في الظهور، دعونا نربطها بإرهاق الذكاء الاصطناعي. على الرغم من أن الاسم يكشف ذلك، إلا أن تسليط الضوء على الأسباب التي تؤدي إلى هذا الإرهاق يضمن الاستخدام المستمر لهذا المصطلح في جميع أنحاء المنشور.  

يبدأ إرهاق الذكاء الاصطناعي بسبب النكسات والتحديات التي تواجهها المؤسسات أو المطورين أو الفرق، مما يؤدي غالبًا إلى فشل في تحقيق القيمة أو تنفيذ أنظمة الذكاء الاصطناعي.

يبدأ الأمر في الغالب بتوقعات غير واقعية لما يستطيع الذكاء الاصطناعي فعله. بالنسبة للتقنيات المتطورة مثل الذكاء الاصطناعي، يحتاج أصحاب المصلحة الرئيسيون إلى التوافق ليس فقط مع قدرات وإمكانيات الذكاء الاصطناعي ولكن أيضًا مع حدوده ومخاطره.

عند الحديث عن المخاطر، غالبًا ما تُعتبر الأخلاقيات فكرة لاحقة تؤدي إلى إلغاء مبادرات الذكاء الاصطناعي غير المتوافقة.

لا بد أنك تتساءل عن دور إدارة البيانات في التسبب في إرهاق الذكاء الاصطناعي - وهو فرضية هذا المنشور.

هذا هو المكان الذي نتجه إليه بعد ذلك. 

يمكن تصنيف إرهاق الذكاء الاصطناعي على نطاق واسع على أنه ما قبل النشر وما بعد النشر. دعونا نركز أولاً على مرحلة ما قبل النشر أولاً.

ما قبل النشر

تساهم عوامل مختلفة في تخريج إثبات المفهوم (PoC) للنشر، مثل:

  • ما الذي نحاول حله؟
  • لماذا يجعل تحديد الأولويات مشكلة ملحة الآن؟
  • ما هي البيانات المتوفرة؟
  • هل هو قابل للحل في المقام الأول؟
  • هل تحتوي البيانات على نمط؟
  • هل الظاهرة قابلة للتكرار؟
  • ما هي البيانات الإضافية التي من شأنها رفع أداء النموذج؟

 

هل تستطيع إدارة البيانات معالجة إرهاق الذكاء الاصطناعي؟
صورة من Freepik 
 

بمجرد تقييمنا أنه يمكن حل المشكلة بشكل أفضل باستخدام خوارزميات التعلم الآلي، يقوم فريق علم البيانات بإجراء تحليل استكشافي للبيانات. يتم الكشف عن العديد من أنماط البيانات الأساسية في هذه المرحلة، مما يسلط الضوء على ما إذا كانت البيانات المقدمة غنية بالإشارة. كما أنه يساعد في إنشاء ميزات هندسية لتسريع عملية تعلم الخوارزمية.

بعد ذلك، يقوم الفريق ببناء النموذج الأساسي الأول، وفي كثير من الأحيان، يجد أنه لا يصل إلى المستوى المقبول. النموذج الذي يكون إنتاجه جيدًا مثل رمي العملة المعدنية لا يضيف أي قيمة. هذه إحدى النكسات الأولى، المعروفة أيضًا باسم الدروس، أثناء بناء نماذج تعلم الآلة.

قد تنتقل المنظمات من مشكلة عمل إلى أخرى، مما يسبب الإرهاق. ومع ذلك، إذا كانت البيانات الأساسية لا تحمل إشارة غنية، فلن تتمكن خوارزمية الذكاء الاصطناعي من البناء عليها. يجب أن يتعلم النموذج الارتباطات الإحصائية من بيانات التدريب للتعميم على البيانات غير المرئية.

ما بعد النشر

على الرغم من أن النموذج المدرب يُظهر نتائج واعدة في مجموعة التحقق من الصحة، بما يتماشى مع معايير العمل المؤهلة، مثل الدقة بنسبة 70%، إلا أنه لا يزال من الممكن أن يحدث الإرهاق إذا فشل النموذج في الأداء بشكل مناسب في بيئة الإنتاج.

يُطلق على هذا النوع من إرهاق الذكاء الاصطناعي اسم مرحلة ما بعد النشر. 

يمكن أن تؤدي أسباب لا تعد ولا تحصى إلى تدهور الأداء، حيث تكون جودة البيانات الرديئة هي المشكلة الأكثر شيوعًا التي يعاني منها النموذج. فهو يحد من قدرة النموذج على التنبؤ بدقة بالاستجابة المستهدفة في غياب السمات الحاسمة. 

ضع في اعتبارك أن إحدى الميزات الأساسية، التي كانت مفقودة بنسبة 10% فقط في بيانات التدريب، أصبحت الآن فارغة بنسبة 50% من الوقت في بيانات الإنتاج، مما يؤدي إلى تنبؤات خاطئة. مثل هذه التكرارات والجهود المبذولة لضمان أداء النماذج باستمرار تؤدي إلى إرهاق علماء البيانات وفرق العمل، مما يؤدي إلى تآكل الثقة في خطوط أنابيب البيانات والمخاطرة بالاستثمارات التي تم إجراؤها في المشروع.

تعد التدابير القوية لإدارة البيانات أمرًا بالغ الأهمية في معالجة كلا النوعين من إرهاق الذكاء الاصطناعي. نظرًا لأن البيانات هي جوهر نماذج تعلم الآلة، فإن البيانات الغنية بالإشارات والخالية من الأخطاء وعالية الجودة تعد أمرًا ضروريًا لنجاح مشروع تعلم الآلة. تتطلب معالجة إرهاق الذكاء الاصطناعي تركيزًا قويًا على إدارة البيانات. لذلك، يجب علينا أن نعمل بصرامة لضمان الجودة الصحيحة للبيانات، ووضع الأساس لبناء نماذج حديثة وتقديم رؤى أعمال جديرة بالثقة.

جودة البيانات

تعد جودة البيانات، وهي مفتاح حوكمة البيانات المزدهرة، عامل نجاح حاسم لخوارزميات التعلم الآلي. يجب على المؤسسات الاستثمار في جودة البيانات، مثل نشر التقارير لمستهلكي البيانات. في مشاريع علم البيانات، فكر في ما يحدث عندما تشق البيانات ذات الجودة السيئة طريقها إلى النماذج، مما قد يؤدي إلى ضعف الأداء.

فقط أثناء تحليل الأخطاء، ستتمكن الفرق من تحديد المخاوف المتعلقة بجودة البيانات، والتي، عند إرسالها ليتم إصلاحها في المراحل الأولية، تؤدي في النهاية إلى التسبب في الإرهاق بين الفرق.

ومن الواضح أن الأمر لا يقتصر على الجهد المبذول فحسب، بل يتم ضياع الكثير من الوقت حتى تبدأ البيانات الصحيحة في التدفق.

ومن ثم، يُنصح دائمًا بإصلاح مشكلات البيانات في المصدر لمنع مثل هذه التكرارات التي تستغرق وقتًا طويلاً. في نهاية المطاف، تشير تقارير جودة البيانات المنشورة إلى فريق علم البيانات (أو، في هذا الصدد، أي مستخدمين آخرين ومستهلكي البيانات) مع فهم الجودة المقبولة للبيانات الواردة.

وبدون تدابير جودة البيانات وإدارتها، سيُثقل علماء البيانات بقضايا البيانات، مما يساهم في النماذج غير الناجحة التي تؤدي إلى إرهاق الذكاء الاصطناعي. 

سلط المنشور الضوء على المرحلتين اللتين يبدأ فيهما إرهاق الذكاء الاصطناعي وعرض كيف يمكن أن تكون تدابير إدارة البيانات مثل تقارير جودة البيانات عامل تمكين لبناء نماذج موثوقة وقوية.

من خلال إنشاء أساس متين من خلال حوكمة البيانات، يمكن للمؤسسات بناء خارطة طريق لتطوير واعتماد الذكاء الاصطناعي بشكل ناجح وسلس، وغرس الحماس.

للتأكد من أن المنشور يقدم نظرة عامة شاملة على الطرق المتنوعة لمعالجة إرهاق الذكاء الاصطناعي، أؤكد أيضًا على دور الثقافة التنظيمية، والتي، جنبًا إلى جنب مع أفضل الممارسات الأخرى مثل حوكمة البيانات، ستمكن فرق علوم البيانات من بناء مساهمات هادفة في الذكاء الاصطناعي عاجلاً وأكبر. أسرع.
 
 

فيدي تشو هو استراتيجي للذكاء الاصطناعي وقائد للتحول الرقمي يعمل عند تقاطع المنتج والعلوم والهندسة لبناء أنظمة تعلم آلي قابلة للتطوير. هي قائدة ابتكار حائزة على جوائز ، ومؤلفة ، ومتحدثة دولية. إنها في مهمة لإضفاء الطابع الديمقراطي على التعلم الآلي وكسر المصطلحات اللغوية للجميع ليكونوا جزءًا من هذا التحول.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة