شعار زيفيرنت

5 مهارات نادرة في علم البيانات يمكن أن تساعدك في الحصول على عمل - KDnuggets

التاريخ:

5 مهارات نادرة في علم البيانات يمكن أن تساعدك في الحصول على عمل
صورة المؤلف
 

إذا كنت تعرف كيفية إنشاء شجرة قرارات للتعلم الآلي، تهانينا، لديك نفس المستوى من الخبرة في الكود مثل ChatGPT والآلاف من علماء البيانات الآخرين الذين يتنافسون على الوظيفة التي تريدها.

أحد الاتجاهات الرائعة بين مديري التوظيف مؤخرًا هو أن القدرة على البرمجة الأولية لم تعد كافية بعد الآن. للحصول على وظيفة، عليك أن تتقدم خطوة فوق معرفة اللغات والأطر وكيفية البحث في StackOverflow. أنت بحاجة إلى فهم مفاهيمي أكبر بكثير، وفهم لمشهد علوم البيانات اليوم - بما في ذلك الأشياء التي تعتقد أن الرئيس التنفيذي للشركة فقط هو الذي يجب أن يهتم بها، مثل إدارة البيانات والأخلاقيات.

هناك العديد من التقنية وغير الفنية مهارات علوم البيانات يجب أن تعرفها، ولكن إذا كنت تواجه صعوبة في الحصول على وظيفة، فقد تكون مهارات علم البيانات الأقل شيوعًا هذه هي تذكرة الدخول إلى باب التوظيف.

في السابق، كان علماء البيانات يعملون بشكل منعزل، في أقبية مظلمة تحت الأرض لإنتاج النماذج. من شأن النماذج أن تخلق تنبؤات أو رؤى؛ سيتم تمرير هذه إلى المديرين التنفيذيين في المجموعة التنفيذية الذين سيتصرفون بناءً عليها دون فهم النموذج الذي أنتج هذه التنبؤات. (أنا أبالغ قليلا، ولكن ليس إلى هذا الحد.)

اليوم، تلعب القيادة دورًا أكثر نشاطًا في فهم منتجات علماء البيانات. وهذا يعني أنك، كعالم بيانات، بحاجة إلى أن تكون قادرًا على شرح سبب قيام النماذج بما تفعله، وكيف تعمل، ولماذا توصلت إلى هذا التنبؤ المحدد.

على الرغم من أنه يمكنك أن تُظهر لرئيسك الكود الفعلي الذي يقوم بتشغيل النموذج الخاص بك، إلا أنه من المفيد جدًا (اقرأ: قابل للتوظيف) أن تكون قادرًا على إظهار كيفية عمل النموذج الخاص بك من خلال التصور. على سبيل المثال، تخيل أنك قمت بتطوير نموذج تعلم الآلة الذي يتنبأ بتراجع العملاء لشركة اتصالات. بدلاً من لقطة شاشة لأسطر التعليمات البرمجية الخاصة بك، يمكنك استخدام مخطط انسيابي أو رسم تخطيطي لشجرة القرار لشرح كيفية تقسيم النموذج للعملاء بشكل مرئي وتحديد أولئك المعرضين لخطر التغيير. وهذا يجعل منطق النموذج شفافًا وسهل الفهم.

تعد معرفة كيفية توضيح التعليمات البرمجية مهارة نادرة، ولكنها بالتأكيد مهارة تستحق التطوير. لا توجد أي دورات تدريبية حتى الآن، ولكن أنصحك بتجربة أداة مجانية مثل Miro لإنشاء مخطط انسيابي يوثق شجرة قراراتك. والأفضل من ذلك، حاول شرح التعليمات البرمجية الخاصة بك لصديق أو أحد أفراد العائلة غير عالم بيانات. كلما زاد الوضع، كان ذلك أفضل.

5 مهارات نادرة في علم البيانات يمكن أن تساعدك في الحصول على عمل
صورة المؤلف
 

يميل العديد من علماء البيانات إلى التركيز على الخوارزميات النموذجية أكثر من التركيز على الفروق الدقيقة في بيانات الإدخال. هندسة الميزات هي عملية اختيار الميزات (متغيرات الإدخال) وتعديلها وإنشائها لتحسين أداء نماذج التعلم الآلي.

على سبيل المثال، إذا كنت تعمل على نموذج تنبؤي لأسعار العقارات، فقد تبدأ بالميزات الأساسية مثل اللقطات المربعة وعدد غرف النوم والموقع. ومع ذلك، من خلال هندسة الميزات، يمكنك إنشاء ميزات أكثر دقة. يمكنك حساب المسافة إلى أقرب محطة نقل عام أو إنشاء ميزة تمثل عمر العقار. يمكنك أيضًا دمج الميزات الحالية لإنشاء ميزات جديدة، مثل "درجة استحسان الموقع" استنادًا إلى معدلات الجريمة وتقييمات المدارس والقرب من وسائل الراحة.

إنها مهارة نادرة لأنها لا تتطلب المعرفة التقنية فحسب، بل تتطلب أيضًا معرفة عميقة بالمجال والإبداع. تحتاج إلى حقا دولار فقط واحصل على خصم XNUMX% على جميع بياناتك والمشكلة المطروحة، ثم قم بتحويل البيانات بطريقة إبداعية لجعلها أكثر فائدة للنمذجة.

غالبًا ما تتم تغطية هندسة الميزات كجزء من دورات التعلم الآلي الأوسع على منصات مثل Coursera أو edX أو Udacity. لكنني أجد أن أفضل طريقة للتعلم هي من خلال الخبرة العملية. اعمل على بيانات العالم الحقيقي وقم بتجربة استراتيجيات هندسة الميزات المختلفة.

إليك سؤال افتراضي: تخيل أنك عالم بيانات في إحدى شركات الرعاية الصحية. لقد تم تكليفك بتطوير نموذج تنبؤي لتحديد المرضى المعرضين لخطر الإصابة بمرض معين. ما الذي من المحتمل أن يكون التحدي الأكبر الذي يواجهك؟

إذا كانت إجابتك "التصارع مع خطوط أنابيب ETL"، فأنت مخطئ. من المرجح أن التحدي الأكبر الذي يواجهك هو التأكد من أن النموذج الخاص بك ليس فعالاً فحسب، بل أيضًا متوافقًا وأخلاقيًا ومستدامًا. يتضمن ذلك التأكد من أن أي بيانات تجمعها للنموذج تتوافق مع لوائح مثل HIPAA وGDPR، اعتمادًا على موقعك. أنت بحاجة إلى معرفة متى يكون استخدام تلك البيانات قانونيًا، وكيف تحتاج إلى إخفاء هويتها، وما هي الموافقة التي تطلبها من المرضى، وكيفية الحصول على تلك الموافقة.

ويجب أن تكون قادرًا على توثيق مصادر البيانات والتحويلات والقرارات النموذجية حتى يتمكن شخص غير خبير من تدقيق النموذج. تعتبر إمكانية التتبع هذه أمرًا حيويًا ليس فقط للامتثال التنظيمي ولكن أيضًا لعمليات التدقيق والتحسينات المستقبلية للنماذج.

أين يمكنك تعلم إدارة البيانات: إنها كثيفة، ولكن أحد الموارد الرائعة هو المجتمع العالمي لإدارة البيانات.

 

5 مهارات نادرة في علم البيانات يمكن أن تساعدك في الحصول على عمل
صورة من dataedo

"أعلم أن علم البيانات يمكنه بشكل أساسي معرفة الإحصائيات، وإنشاء النماذج، والعثور على الاتجاهات، ولكن إذا سألتني، لا أستطيع التفكير في أي معضلات أخلاقية حقيقية، أعتقد أن علم البيانات ينشر الحقائق الحقيقية فقط." محمد مستخدم Reddit Karls_tec17، خطأ.

وبعيدًا عن الامتثال القانوني، هناك جانب أخلاقي يجب مراعاته. يجب عليك التأكد من أن أي نموذج تقوم بإنشائه لا يقدم عن غير قصد تحيزات يمكن أن تؤدي إلى معاملة غير متساوية لمجموعات معينة.

أنا أحب المثال نموذج التوظيف القديم في أمازون لتوضيح سبب أهمية الأخلاق. إذا لم تكن على دراية بذلك، فقد حاول علماء البيانات في أمازون تسريع سير عمل التوظيف من خلال إنشاء نموذج يمكنه اختيار التعيينات المحتملة بناءً على السير الذاتية. وكانت المشكلة أنهم قاموا بتدريب النموذج على قاعدة السير الذاتية الحالية لديهم، والتي كانت يهيمن عليها الذكور بشكل كبير. كان نموذجهم الجديد متحيزًا نحو الموظفين الذكور. وهذا غير أخلاقي للغاية.

لقد تجاوزنا حتى الآن مرحلة "التحرك بسرعة وكسر الأشياء" في علم البيانات. الآن، كعالم بيانات، عليك أن تعرف أن قراراتك سيكون لها تأثير حقيقي على الناس. لم يعد الجهل عذرا؛ يجب أن تكون على دراية كاملة بجميع التداعيات المحتملة التي يمكن أن يحدثها نموذجك، وسبب اتخاذه للقرارات التي يتخذها.

UMichigan لديه مفيدة الدورة حول "أخلاقيات علم البيانات". اعجبني ايضا هذا الكتاب لتوضيح سبب وكيفية ظهور الأخلاق حتى في العلوم "المعتمدة على الأرقام" مثل علم البيانات.

إحدى الحيل السرية في الحياة هي أنه كلما عرفت كيفية التسويق بشكل أفضل، كلما كان من الأسهل عليك الحصول على وظيفة. وأعني بكلمة "السوق" "معرفة كيفية جعل الأشياء مثيرة". مع القدرة على التسويق، ستكون أفضل في إنشاء سيرة ذاتية تبيع مهاراتك. سوف تكون أفضل في سحر الشخص الذي يجري معك المقابلة. وفي علم البيانات على وجه التحديد، ستكون أفضل في شرح سبب أهمية نموذجك - ونتائج نموذجك.

تذكر أنه لا يهم مدى جودة نموذجك إذا لم تتمكن من إقناع أي شخص آخر بأنه ضروري. على سبيل المثال، تخيل أنك قمت بتطوير نموذج يمكنه التنبؤ بأعطال المعدات في أحد المصانع. من الناحية النظرية، يمكن للنموذج الخاص بك أن يوفر على الشركة الملايين في أوقات التوقف غير المخطط لها. ولكن إذا لم تتمكن من إيصال هذه الحقيقة إلى كبار المسؤولين، فإن النموذج الخاص بك سيظل غير مستخدم على جهاز الكمبيوتر الخاص بك.

من خلال المهارات التسويقية، يمكنك إثبات استخدامك والحاجة إلى نموذجك من خلال عرض تقديمي مقنع يسلط الضوء على الفوائد المالية، وإمكانية زيادة الإنتاجية، والمزايا طويلة المدى لاعتماد نموذجك.

هذه مهارة نادرة جدًا في عالم علم البيانات لأن معظم علماء البيانات هم أشخاص أرقام في القلب. يعتقد معظم علماء البيانات المحتملين أن مجرد بذل قصارى جهدك وإبقاء رأسك منخفضًا هو استراتيجية توظيف ناجحة. لسوء الحظ، أجهزة الكمبيوتر ليست هي التي تقوم بتوظيفك، بل الأشخاص هم من يقومون بذلك. تعد القدرة على تسويق نفسك ومهاراتك ومنتجاتك ميزة حقيقية في سوق العمل اليوم.

لتتعلم كيفية التسويق، أوصي ببعض الدورات المجانية للمبتدئين مثل "التسويق في العالم الرقمي" مقدمة من كورسيرا. لقد أعجبني بشكل خاص القسم الخاص بـ "تقديم أفكار المنتجات التي تظل عالقة في العالم الرقمي". لا توجد أي دورات تسويقية خاصة بعلوم البيانات، لكني أحببتها هذا بلوق وظيفة يشرح كيفية تسويق نفسك كعالم بيانات.

انها صعبة هناك. على الرغم من وجود أ النمو المتوقع من توظيف علماء البيانات، وفقًا لمكتب إحصاءات العمل، يجد العديد من الطامحين في علوم البيانات المبتدئين صعوبة في الحصول على وظيفة، as هؤلاء رديت المشاركات توضيح. هناك منافسة من ChatGPT ونسور التسريح من العمل تدور حولها.

للمنافسة والتميز في سوق العمل، عليك أن تتجاوز مجرد القطع الفنية. إن حوكمة البيانات، والأخلاقيات، والنموذج، وهندسة الميزات، ومهارات التسويق تجعلك مرشحًا أكثر تفكيرًا وقوة وإثارة للاهتمام لمديري التوظيف.
 
 

نيت روزيدي هو عالم بيانات وفي استراتيجية المنتج. وهو أيضًا أستاذ مساعد يقوم بتدريس التحليلات ، وهو مؤسس ستراتا سكراتش، وهي منصة تساعد علماء البيانات على الاستعداد لمقابلاتهم مع أسئلة مقابلة حقيقية من الشركات الكبرى. تواصل معه تويتر: StrataScratch or لينكدين:.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة