شعار زيفيرنت

قصة نجاح عالم البيانات الأقدم في Microsoft

التاريخ:

المُقدّمة

في العصر الرقمي اليوم ، لا يمكن إنكار قوة البيانات ، وأولئك الذين يمتلكون المهارات لتسخير إمكاناتها هم من يقودون مهمة تشكيل مستقبل التكنولوجيا. من بين هؤلاء الرواد ، يقف فرد استثنائي ، السيد نيرمال ، صاحب رؤية في عالم علوم البيانات ، والذي نما ليصبح قوة دافعة في أحد عمالقة التكنولوجيا الأوائل في العالم ، حيث يعمل ككبير علماء البيانات في Microsoft.

قابل السيد نيرمال ، تجسيد المثابرة والذكاء والتفاني الذي لا يتزعزع. من بداياته المتواضعة ، شرع السيد نيرمال في رحلة تحويلية قادتهم إلى قمة حياتهم المهنية كعلماء بيانات أول في Microsoft. يعتبر صعوده النيزكي بمثابة قصة نجاح ملهمة ، ليس فقط لعلماء البيانات الطموحين ولكن لأي شخص لديه حلم وتصميم على تحقيق العظمة.

في مقال قصة النجاح هذا ، نتعمق في رحلة السيد نيرمال ، ونتتبع المعالم والتحديات والانتصارات الرئيسية التي شكلت حياتهم المهنية غير العادية. نستكشف المشاريع الرائدة التي قادها ، والأثر التحويلي الذي أحدثه ، والدروس القيمة التي تعلمها على طول الطريق. من خلال قصة السيد نيرمال ، نكتشف السمات والعقلية الضرورية للازدهار في عالم علم البيانات المتطور باستمرار.

كبير علماء البيانات في Microsoft | علم البيانات

لنبدأ بالمحادثة!

AV: يرجى تحديد مسار حياتك المهنية وخلفيتك التعليمية وكيف ساعدتك في الحصول على أول وظيفة لعالم بيانات؟

سيد نيرمال: مساري المهني لم يكن أبدًا مسارًا خطيًا. كل منا لديه قصصه الخاصة ، وأنا متأكد من أنها كلها ممتعة. ها هي لي: لقد أكملت دراستي الجامعية في هندسة تكنولوجيا المعلومات من نيبال. انتقلت إلى الولايات المتحدة في عام 2007 للحصول على درجة الماجستير. بعد الانتهاء من الماجستير ، التحقت بالجيش الأمريكي. نعم ، يبدو الأمر غير مألوف للغاية. بسبب الركود الكبير في الولايات المتحدة حوالي عام 2009 (والذي صادف أن يكون عام تخرجي أيضًا) ، كان سوق العمل سيئًا للغاية ، خاصة بالنسبة للطلاب الدوليين. كان هناك برنامج تجريبي خاص يديره الجيش الأمريكي ، وقد مررت بجميع العمليات المطلوبة لأصبح عضوًا في الخدمة. كبرت ، كان لدي بعض الشغف للانضمام إلى الجيش. يا لها من طريقة لتحقيق ذلك. 

بينما كنت في الجيش ، أكملت ماجستير إدارة الأعمال. في عام 2014 ، بعد الانتهاء من عقد التجنيد الأول ، تركت الجيش الأمريكي. في نفس العام ، حصلت على أول منصب بيانات لي كمحلل للأمن السيبراني ، أعمل كموظف في الحكومة الفيدرالية الأمريكية في وزارة البحرية. أكملت درجة الماجستير الثالثة في علوم البيانات أثناء عملي في هذه الوظيفة. بعد اكتساب بعض الخبرة في العمل كمحلل بيانات ، وبناء أوراق الاعتماد الأكاديمية بالإضافة إلى المهارات في علوم البيانات ، انتقلت إلى الصناعة الخاصة وأخذت دوري الأول كعالم بيانات في Wells Fargo Bank في 3. ومنذ ذلك الحين كنت في مجال البيانات علمي ، وأعمل حاليًا ككبير علماء البيانات لشركة Microsoft.

AV: هل يمكنك إخبارنا عن مشروع عملت عليه حيث كان عليك استخدام البيانات لحل مشكلة حقيقية وتأثيرها على العمل أو استراتيجية المنتج؟

سيد نيرمال: هناك العديد من الأمثلة. بادئ ذي بدء ، لا يتعين علينا إجراء "عالم البيانات' عنوان العمل وحل أي مشاكل في البيانات. هناك بعض المفاهيم الخاطئة من هذا القبيل. يمكننا العمل كمحللي بيانات أو مهندسي بيانات أو محللي أعمال أو أي عناوين تعمل مع البيانات.  

أنا أعمل في الغالب في مجال الأمن السيبراني. اثنان من مجالات التركيز الرئيسية بالنسبة لنا هما: التحقيق والكشف. عند التعامل مع الأمن الإلكتروني المشاكل ، واحدة من مساحات المشاكل الشائعة جدًا هي اكتشاف الشذوذ. لقد عملت في فريق علم البيانات لبناء أنظمة احتجاز شاذة ، مما يساعد محللي الأمن على توفير الوقت في الأحداث / التنبيهات التي يجب التركيز عليها. التأثير على توفير الوقت والموارد.

AV: ما هي أصعب مشكلة قمت بحلها باستخدام علم البيانات؟ كيف تعاملت مع المشكلة؟ ماذا كانت النتيجة؟

سيد نيرمال: أود أن أقول - المشكلة الأكثر صعوبة بالنسبة لي لم يتم حلها بعد. نظرًا لأننا نعيش في عالم الذكاء الاصطناعي المبتكر للغاية ، يجب أن ندرك دائمًا أن الخصوم لديهم الآن الأدوات الأكثر تقدمًا من أي وقت مضى. ومع ذلك ، إذا اضطررت إلى ذكر مشكلة واحدة مثيرة للاهتمام ، فسأختار تحليل سلوك المستخدم أو يسمى أيضًا تحليل سلوك كيان المستخدم ، والمعروف على نطاق واسع باسم UEBA في الصناعة. UEBA هي نوع من ميزات الأمن السيبراني التي تكتشف التهديدات من خلال تحديد نشاط المستخدم الذي ينحرف عن خط الأساس العادي.

مثال واحد بسيط: لدينا مستخدم يسجل الدخول غالبًا من الموقع أ ، وفجأة نرى نشاط تسجيل الدخول من الموقع ب. قد يكون هذا أمرًا طبيعيًا مرتبطًا بالسفر ، لكنه لا يزال انحرافًا عن السلوك الطبيعي ، لذا يجب النظر إليه لتأكيد الحالة الطبيعية مقابل . الحقد. يتمثل الجزء الأكثر تحديًا في UEBA في فهم وإنشاء خط الأساس. 

رؤى تعتمد على البيانات

علم البيانات مقابل تعلم الآلة | كبير علماء البيانات في Microsoft | علم البيانات

AV: هل يمكنك مشاركة قصة عن وقت اضطررت فيه إلى توصيل رؤى معقدة قائمة على البيانات لأصحاب المصلحة غير التقنيين؟ كيف تأكدت من فهمهم للرؤى وتأثيرها على العمل؟

سيد نيرمال: بصفتنا عالم بيانات ، سنواجه سيناريوهات متعددة مثل هذه. معظم أصحاب المصلحة في الأعمال على دراية جيدة بمشاكلهم والحلول المقصودة. لكن في بعض الأحيان يكون من الصعب أن أشرح لهم لماذا تكون بعض الحلول منطقية ولماذا البعض لا. يمكنني مشاركة مثال واحد. بنينا نموذج كشف الاحتيال، كان مصنفًا ثنائيًا مع معاملات احتيال مقابل معاملات غير احتيالية. يعرف محللو الاحتيال مجالهم جيدًا. لكن بالنسبة لنا لشرح نتائج النموذج لهم كان من الصعب تقسيمها إلى لغتهم.

إذا شاركنا تفاصيل مثل - ضبط النموذج والمعلمات الفائقة أو طرق التحقق من الصحة أو أخذ العينات ، فستكون هذه الأشياء أقل منطقية بالنسبة لهم. ومع ذلك ، إذا فسرنا إلى مستويات أعلى مثل السمات التي وجدناها مفيدة بناءً على تصنيف الميزات ، فما هي بعض التحديات التي تواجه الفصول الدراسية غير متوازنة ، فستكون هذه الأشياء منطقية بالنسبة لهم. لذلك من المهم دائمًا أن يتحدث عالم البيانات بلغة الأعمال أيضًا.

 

AV: كيف تتأكد من أن نماذج التعلم الآلي التي يبنيها فريقك قابلة للتفسير وشفافة للمستخدمين النهائيين ، لا سيما في سياق الأمن واكتشاف التهديدات؟

سيد نيرمال: كما ذكرت في مثال سابق ، تعد قابلية التشغيل البيني للنموذج مهمة جدًا عندما يتعلق الأمر بشرحها مرة أخرى لشركاء الأعمال. هذا مهم بغض النظر عن المجال الذي تعمل به. في الأمن واكتشاف التهديدات ، يصبح الأمر أكثر أهمية لأن أي شيء نبنيه كنموذج ، يجب أن يكون قابلاً للتفسير لمحللي التهديد حتى يتمكنوا من اتخاذ الإجراءات المناسبة. أحد الأمثلة الجيدة التي يمكنني مشاركتها هنا هو مفهوم Benign Positive. عندما سمعت عن هذا المصطلح لأول مرة ، كنت في حيرة من أمري ، لأنني كنت على دراية فقط بالإيجابيات الحقيقية ، والإيجابيات الكاذبة. لكن في مجال الأمن ، الإيجابيات الحميدة مهمة. فيما يلي تفصيل تلك الفئات:

  • موجب حقيقي (TP): إجراء ضار تم اكتشافه بواسطة أداة أمان.
  • حميد صحيح إيجابي (B-TP): إجراء تم اكتشافه بواسطة أداة أمان حقيقي ، ولكن ليس ضارًا ، مثل اختبار اختراق أو نشاط معروف تم إنشاؤه بواسطة تطبيق معتمد.
  • إيجابية كاذبة (FP): إنذار كاذب ، بمعنى أن النشاط لم يحدث.

AV: هل سبق لك أن واجهت موقفًا كانت فيه البيانات التي كنت تعمل بها فوضوية أو غير كاملة؟ كيف تعاملت معها وماذا كانت النتيجة؟

سيد نيرمال: هذا يحصل طوال الوقت. إذا قال أحد علماء البيانات إنه حصل على بيانات نظيفة للعمل معها ، فسيكون ذلك بمثابة الفوز بتذكرة يانصيب له / لها. لا تشبه مشاريع العالم الحقيقي منافسة Kaggle حيث تأتي البيانات في الغالب نظيفة كملفات csv. نقضي المزيد من الوقت على احتياجات البيانات ، والعمل مع مالكي البيانات من أجل عقد البيانات ، وجمع البيانات. هذه هي الأشياء التي تأتي قبل تحليل البيانات استكشافية (EDA) يحدث.

في معظم الأوقات ، نواجه بيانات فوضوية مع بعض التناقضات مع المخطط. يعد تعيين إصدارات البيانات أمرًا مهمًا ، حيث نتتبع كل إصدار من البيانات عندما نكرر عدة مرات لتنسيق خط أنابيب ETL حتى نحصل على البيانات الصحيحة. هناك مفهوم لملاحظة البيانات وهو ما يعني بالضبط نفس ما ذكرته هنا. تتعامل مع الحصول على البيانات الصحيحة إلى الوجهات الصحيحة ، بالتنسيقات الصحيحة ، في الوقت المناسب. 

 

AV: هل يمكنك إخبارنا عن مشروع تعاونت فيه مع فريق لتحقيق هدف مشترك؟ كيف ساهمت في نجاح الفريق؟ ماذا تعلمت من التجربة؟

سيد نيرمال: في Microsoft ، نتبع شيئًا يسمى "One Microsoft" ، والذي يركز على تطوير الخدمات والمنتجات التي ستتبنى ثقافة التعاون عبر الفرق لابتكار مفاهيم جديدة والعمل عليها معًا ، بدلاً من العمل بطرق منعزلة. تقريبا جميع المشاريع التي عملت عليها بالتعاون مع فرق أخرى - والتي يمكن أن تكون نظراء هندسيين أو فرق خارجية. أحد الأشياء الجيدة في ثقافة Microsoft هو أنها تجعلنا نركز على بناء أنظمة فوق الخدمات الحالية ، بدلاً من إعادة اختراع العجلات. هذا لا يعزز بناء العلاقات مع الفرق الأخرى فحسب ، بل يوفر أيضًا الوقت والموارد للشركة. أنا شخصياً تعلمت أشياء كثيرة من خلال العمل مع فرق مختلفة.

مشاريع أمن البيانات

أ.في: ذكرت أنك تحب العمل عند تقاطع الأمن وعلوم البيانات. هل يمكنك مشاركة قصة نجاح حول مشروع استخدمت فيه البيانات لتحسين إجراءات الأمان أو منع الانتهاكات الأمنية؟ ماذا كان تأثير المشروع؟

سيد نيرمال: هذا سؤال عظيم. شكرا لجلب عنه. نظرًا لوجود البيانات في كل مكان ، يصبح علم البيانات قابلاً للتطبيق على جميع المجالات. أقترح عادةً على علماء البيانات المهنية المبكرة تجربة مسارات متعددة ، على الأقل لديهم ثلاثة مجالات اهتمام حتى تتمكن من إجراء التجربة والخطأ ، تمامًا مثل نماذج التعلم الآلي للتدريب ، يعد اختيار المسار الوظيفي عملية تكرارية في بداية حياتك المهنية. يعد علم الأمان والبيانات أحد التوليفات النادرة والفريدة من نوعها. هناك طلب على سوق العمل ، وفي ظل الاقتصاد القاسي ، يكون الأمن الوظيفي أقوى أيضًا في هذا المجال.

لمشاركة قصتي ، أحد أفضل الأشياء بالنسبة لي كوني في الأمن هو أنه مجال دائم التطور. يبتكر المتسللون استراتيجيات وأدوات جديدة ، وعلينا الرد على ذلك في أي وقت من الأوقات. أحد المشاريع البسيطة والمفيدة من وجهة نظر الأعمال ، والتي كنت جزءًا منها هو - تصنيف التنبيهات. نظرًا لأن الباحثين الأمنيين يجدون أنماطًا مختلفة للهجوم ، فإنهم يساعدون مهندسي الأمن في كتابة قواعد الكشف ، والتي بدورها تطلق تنبيهات في حالة وجود تطابق أو تجاوز للقواعد. لكن المشكلة هي أن كل نظام يولد آلاف الأحداث التي يتم تحويلها إلى تنبيهات. المعدل الإيجابي الخاطئ في تلك التنبيهات مرتفع.

لتحقيق التوازن بين الأمان والكفاءة ، قمنا بتطوير نموذج ML لتصنيف التنبيهات إلى إيجابيات حقيقية وإيجابيات حميدة وإيجابيات كاذبة ، مرتبة حسب درجات المخاطر. يتيح ذلك للمحللين تحديد أولويات قوائم الانتظار الخاصة بهم وتجنب الأحجام الهائلة من التنبيهات مع تقليل مخاطر انزلاق الخصوم دون أن يتم اكتشافهم.

نصائح حول التعامل مع الرؤى غير المتوقعة

AV: هل سبق لك أن واجهت موقفًا أظهرت فيه البيانات رؤى غير متوقعة أو مفاجئة؟ ما هو اقتراحك للتعامل مع تلك السيناريوهات؟

سيد نيرمال: أحد الأشياء التي غالبًا ما نفتقدها أثناء مرحلة تحليل البيانات الاستكشافية (EDA) هو أننا قد لا نطرح الأسئلة الصحيحة على البيانات. إذا اتبعنا فقط العملية القياسية لإجراء الإحصائيات الوصفية ، والتحليل الأحادي أو متعدد المتغيرات ، والخرائط الحرارية للارتباط ، وما إلى ذلك ، وهي خطوات أساسية لـ EDA ، فمن المحتمل أن نفقد العثور على رؤى أساسية.

مثال واحد: العملية الأكثر شيوعًا التي يجب اتباعها عندما نواجه القيم المتطرفة في بياناتنا هي إسقاطها ، لأنها ستؤدي إلى انحراف التوزيع. ومع ذلك ، فإن إسقاطها ليس دائمًا فكرة جيدة ، ويعتمد على مشروعك. ماذا لو كنا نقوم بمشروع اكتشاف الشذوذ ، فيمكن أن تكون القيم المتطرفة هي تلك الحالات الشاذة التي نحاول العثور عليها. في هذه الحالة ، لا يعد الاستغناء عن بيانات التدريب قرارًا حكيمًا. من الأفضل دائمًا مراجعة خبراء المجال قبل إسقاط أي نوع من البيانات ، حتى البيانات المفقودة. 

نصيحة لتصبح عالم بيانات ناجحًا

AV: ما هي النصيحة التي تقدمها لشخص يريد أن يصبح عالم بيانات ناجحًا في عملاق تقني مثل Microsoft؟

سيد نيرمال: لا تقتصر اقتراحاتي على Microsoft فقط ولكنها تنطبق بشكل عام على كل صناعة وشركة. إذا كان عليّ التلخيص في بضع نقاط:

  • ابق جائعا لتعلم أشياء جديدة: صناعة علوم البيانات تتحرك دائمًا بوتيرة سريعة. التعلم المستمر مهم جدا في هذا المجال.
  • بناء شبكتك: احضر المؤتمرات ، وكن جزءًا من قنوات المجتمع في LinkedIn ، وساهم في المجتمع من خلال كتابة مقالات في منصات علوم البيانات الشائعة مثل الوسائط ، أو نحو علم البيانات. تساعد الشبكات كثيرًا. 
  • ركز على المشاريع المؤثرة: يمكن أن يضعك لقب عالم البيانات في العديد من المسؤوليات - بعضها يقوم بأعمال هندسة البيانات ، والبعض الآخر يقوم بعمل محلل البيانات. بغض النظر ، أقترح عليك التركيز على المشاريع عالية التأثير حيث يمكنك جعل مساهماتك أكثر وضوحًا ، ويمكن قياسها من خلال نتائج ملموسة.

وفي الختام

في الختام ، تعد قصة نجاح السيد نيرمال مثالاً ساطعًا على الارتفاعات المذهلة التي يمكن تحقيقها عندما تتلاقى المواهب والفرص والتفاني الذي لا يتزعزع. أثبت كبير علماء البيانات في Microsoft أن قوة البيانات ، عند تسخيرها بذكاء وهدف ، لديها القدرة على تحويل الصناعات ، وتشكيل المستقبل ، وإنشاء إرث سيستمر للأجيال القادمة.

أخيرًا ، أود أن أشكر Analytics Vidhya لمنحي هذه الفرصة لمشاركة تجربتي. لجميع جمهوري ، لا تتردد في التواصل معي لينكدين:

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة