شعار زيفيرنت

أفضل دورات بايثون: ملخص تحليلي

التاريخ:

By بريندان مارتن، المؤسس ورئيس التحرير ، LearnDataSci

المُقدّمة

 
ماذا تكشف البيانات إذا سألنا: "ما هي أفضل 10 دورات بايثون؟". يُظهر جمع جميع الدورات تقريبًا من أفضل المنصات أن هناك الكثير للاختيار من بينها ، مع أكثر من 3000 عرض.

تلخص هذه المقالة تحليلي وتقدم أفضل ثلاث دورات. للحصول على المقالة الكاملة ، والتي تتضمن جميع الكود المطلوب لإعادة إنتاج نتائجي ، يرجى الاطلاع على الأصل: أفضل 10 دورات لغة بايثون وفقًا لتحليل البيانات.

TL ؛ DR: الفائزون

 
من بين جميع الدورات التي تم جمعها ، أظهر التحليل أن هذه كانت المراكز الثلاثة الأولى:

  1. تعلم لغة Python بواسطة Codecademy
  2. مقدمة في برمجة بايثون بواسطة Udacity
  3. البرمجة للجميع (بدء استخدام Python) بواسطة Coursera

لذا ، إذا كنت هنا فقط للحصول على توصيات ، فتحقق من المراكز الثلاثة الأولى. ومع ذلك ، إذا كنت مهتمًا بالبيانات والأساليب المستخدمة لإنشاء أفضل النتائج ، فتابع القراءة للحصول على ملخص كامل.

التنازلات والافتراضات

 
يتطلب تحليل البيانات اتباع نهج اختزالي للعالم. في كثير من الأحيان ، يجب اختيار البيانات بسبب احتمال ارتباطها جيدًا بالممتلكات المرغوبة. هذه التنازلات والافتراضات ضرورية ، ولكن بنفس القدر القدرة على تحديد الافتراضات التي وضعناها. بهذه الطريقة ، يمكن للآخرين انتقاد نهجك وفهم حدوده.

الافتراضات:

  • ترتيب محرك البحث جوجل هو انعكاس عادل لكمية ونوعية الروابط الخلفية
  • أن شعبية صفحة الدورة التدريبية ترتبط ارتباطًا إيجابيًا بعدد الروابط الفريدة الخاصة بها
  • أن شعبية صفحة الدورة التدريبية مرتبطة بشكل إيجابي بحركة المرور الخاصة بها
  • أن يكون اختيار المنصات المستخدمة في التحليل شاملاً
  • تصفية بيانات "Python" في عنوان URL أو أعلى كلمة رئيسية للصفحة لم تستبعد الدورات التدريبية ذات الصلة أو تتضمن دورات غير ذات صلة

القيود:

  • Ahrefs الأساسية توفر الخطة المستخدمة أفضل 50 نتيجة بحث على Google ، وليس المجموعة الكاملة الممكنة
  • تقييم نطاق Ahref هو مجرد تقدير لخوارزمية Google السرية

تحضير البيانات

 
غالبًا ما يكون إعداد البيانات للتحليل هو الخطوة الفردية الأكثر تطلبًا. في هذه الحالة ، أنا:

 
1. تم تصدير كل نظام أساسي للدورة التدريبية إلى ملفات CSV منفصلة.

نحن نعلم بالفعل أننا سنحتاج إلى مزيد من تصفية البيانات لاستبعاد بعض الصفحات غير ذات الصلة ، ولكن هذا في وقت لاحق.

 
2. تأكد من أن بيئتنا Python بها المكتبات المطلوبة: الباندا, matplotlib / seabornو scipy.

ستساعد هذه المكتبات في استكشاف البيانات وتصورها.

 
3. قم بعمل DataFrame فارغ ، وسلسلة كل ملف في DataFrame.

نظرًا لأن كل ملف CSV له فهرس خاص به ، فنحن بحاجة إلى reset_index لعمل فهرس جديد لإطار البيانات المدمج.

 
4. افحص البيانات لإنشاء مرشحات ذات مغزى

هذا يتعامل مع القضية المذكورة في 1.

 
5. إزالة التكرارات

على سبيل المثال ، يمكن أن يكون عنوان URL "http" أو "https" وقد يحتوي أو لا يحتوي على www.

 
6. هندسة الميزات التطبيقية لإنشاء مصطلح تفاعل بين إحالة المجالات وحركة المرور.

احسب درجات z الخاصة بالمرور والمجالات المرجعية لإنشاء خاصية جديدة: متوسط ​​درجتي z باستخدام مكتبة scipy.

 
7. كرر جولة أخرى من التنظيف

على سبيل المثال ، تم تصنيف دورة Codecademy لـ Python 2 في الأعلى ولكن تم استبدالها بـ Python 3. الحل: احتفظنا بموقع Codecademy وقمنا بتغيير المسار الموصى به. في الوقت الحالي ، يعد الفطرة البشرية بمثابة مدخلات حاسمة لهذا النوع من التحليل.

عرض مرئي للمعلومات

 
كما هو معتاد ، بدأ تصور البيانات خلال مراحل إعداد البيانات. يساعد على الشعور بما يعكر المياه.

على سبيل المثال ، بمجرد رسم الدورات التدريبية من خلال حركة المرور ونطاقات الإحالة الخاصة بهم ، كان من الواضح أنه لا يزال لدينا بعض عمليات التنظيف الرئيسية التي يجب القيام بها (الخطوة 7 أعلاه) لإزالة الدورات التدريبية غير ذات الصلة. يوضح الرسم التالي بعض الدورات التدريبية غير ذات الصلة التي تم تضمينها في البيانات:

أفضل دورات بايثون: ملخص تحليلي


 

يتطلب القيام بالتمثيل المرئي عادةً إنشاء إطار بيانات جديد يقوم بتجميع البيانات بالتنسيق الذي تحتاجه. على سبيل المثال ، دورات Python وحركة المرور حسب النظام الأساسي كمخطط شريط مجمع:

أفضل دورات بايثون: ملخص تحليلي


 

تؤدي المؤامرة المذكورة أعلاه إلى ملاحظة مثيرة للاهتمام: المزيد من الدورات التدريبية المتعلقة ببايثون على النظام الأساسي يعني بالضرورة المزيد من حركة المرور. يبدو أن هذا يؤكد القول المأثور بأن الجودة هي الكمية الأكثر أهمية.

التحليل النوعي

 
أعطانا التحليل الكمي تصنيفاتنا. للحصول على بعض التحليل النوعي للإصدارات المجانية من الدورات التدريبية ، انضممت إليهم وقمت بمشاركة انطباعاتي.

 
1. تعلم لغة Python بواسطة Codecademy

الشهادة: ✔ الاختبارات: ✔ المشاريع: ✔ التفاعلية: ✔

دورة تدريبية قوية على مستوى المبتدئين لحل المشكلات مع Python ، وتغطي الموضوعات الأساسية التي غالبًا ما تتجاهلها الدورات التدريبية الأخرى تمامًا.

 
2. مقدمة في برمجة بايثون بواسطة Udacity

فيديو: ✔ الاختبارات: ✔

لا تزال هذه الدورة التدريبية على مستوى المبتدئين تقدم قيمة جيدة على الرغم من عدم إعجابي بقدر إعجاب الآخرين. على سبيل المثال ، على عكس Codecademy ، يحتوي كل درس على محاضرة مسجلة.

 
3. البرمجة للجميع (بدء استخدام Python) بواسطة Coursera

الشهادة: ✔ (مع الدفع) فيديو: الاختبارات: ✔

تعد مقاطع الفيديو الخاصة بهذه الدورة التدريبية أكثر تنظيمًا وتسلية من مقاطع الفيديو الأخرى التي جربتها. يبدأ مستوى الوتيرة والصعوبة منخفضًا ، لكنه (في النهاية) يقودك إلى معرفة متوسطة المستوى ببايثون. تم تصميم بيئة تعلم Python جيدًا بشكل خاص.

وفي الختام

 
تبدو دورة Codecademy بمثابة رهان آمن لبدء رحلة Python. ولكن ، بغض النظر عن الدورة التي تختارها ، تعامل مع المشاريع كثيرًا قدر الإمكان. ابحث عن مشكلة تهتم بها واستمر في البرمجة حتى تحصل على شيء يحلها. أظهر الحل الذي تقدمه ، واستخدمه لمساعدة الآخرين ، بل واعمل على الخروج منه. يعد استخدام Python - والبرمجة بشكل عام - لإنشاء قيمة لنفسك وللآخرين حلقة ملاحظات مجزية ستبقيك تعمل ، وتمضي قدمًا ، وتتحسن.

نأمل أن تساعدك هذه المقالة في رحلة بايثون. تفحص ال المقال الأصلي لمزيد من التفاصيل ، أكمل التعليمات البرمجية ، وبقية العشرة الأوائل.

 
 
بريندان مارتن هو المؤسس ورئيس التحرير ، LearnDataSci. يجعل LearnDataSci تعلم علوم البيانات عبر الإنترنت متاحًا للجميع. مقالات شهرية موجهة نحو مساعدة المتعلمين عبر الإنترنت في الحصول على فهم بديهي لعلوم البيانات وموضوعات التعلم الآلي التي تعتبر ضرورية لمهن علوم البيانات.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة