شعار زيفيرنت

استكشاف اتجاهات دورات Udemy باستخدام Google Big Query

التاريخ:

المُقدّمة

يعد Google Big Query عبارة عن خدمة مستودع بيانات متعددة السحاب كخدمة (PaaS) آمنة ، ويمكن الوصول إليها ، ومدارة بالكامل ، ودفع عند الاستخدام ، وبدون خادم ، ومقدمة من نظام التشغيل السحابي من غوغل تساعد في تكوين رؤى مفيدة من البيانات الضخمة من شأنها أن تساعد أصحاب المصلحة التجاريين في اتخاذ قرارات فعالة. يوفر Google Big Query إمكانية مدمجة للتعلم الآلي ومحرك استعلام SQL لكتابة SQL ، والتي يمكن استخدامها لتحليل مجموعات البيانات الكبيرة. يمكننا تطوير مستودع بيانات آمن وسهل الوصول إليه باستخدام Google Big Query.

Udemy هي واحدة من أشهر منصات التعلم عبر الإنترنت. يوفر Udemy محتوى تعليميًا عالي الجودة في التصميم والتسويق والتطوير والتمويل والمحاسبة وتكنولوجيا المعلومات والبرمجيات والتصوير الفوتوغرافي والفيديو والصحة والعافية وإنتاجية المكاتب وما إلى ذلك بلغات مختلفة. Udemy هو مصدر مهم للمعلومات للعديد من الطلاب والمستقلين والمهنيين العاملين. Udemy هي واحدة من أفضل المنصات لتعلم Python و React والتحضير لشهادة AWS و Azure. ومع ذلك ، قد يكون المتعلمون مهتمين بأخذ دورات من مدربين أكثر انسجامًا مع عناوين وظائفهم ، والدورات التي يأخذها العديد من المستخدمين ، والمطورين المعتمدين مثل AWS المعتمد ، والمعتمد من Salesforce ، وما إلى ذلك. لمعالجة هذه المشكلة ، سننشئ مستودع بيانات لاستكشاف اتجاهات ورؤى دورة Udemy باستخدام Google Big Query.

يوفر جميع مزودي الخدمات السحابية الرئيسيين تقريبًا ، مثل Google و Amazon و Microsoft وما إلى ذلك ، اليوم أدوات تخزين البيانات. أدوات مستودع البيانات المستندة إلى السحابة قابلة للتطوير بدرجة كبيرة وتوفر التعافي من الكوارث. باستخدام أ مستودع البيانات يمكننا تخزين كمية كبيرة من البيانات وتحليلها وإنتاج رؤى مفيدة للبيانات بمساعدة تصورات البيانات والتقارير. توفر مستودعات البيانات المصممة جيدًا بيانات عالية الجودة وتحسن أداء الاستعلام من خلال تحديد نوع البيانات بشكل صحيح ، واستخدام التنقيب عن البيانات ، والذكاء الاصطناعي ، وما إلى ذلك ، والمساعدة في اتخاذ قرارات أكثر ذكاءً.

ستناقش هذه المقالة نهج بناء مستودع بيانات لاستكشاف اتجاهات ورؤى دورة Udemy باستخدام Google Big Query والتي ستساعدنا على تحديد أشياء مثل تصنيف الدورات بناءً على المسميات الوظيفية للمدرس ، ومتوسط ​​التقييم لجميع الدورات التدريبية للمعلم ، إلخ.

أهداف التعلم

في هذه المقالة سوف نتعلم:

  1. كيفية إنشاء مستودع بيانات باستخدام Google Big Query
  2. كيفية استخدام Google Big Query Sandbox
  3. اكتساب المعرفة حول إنشاء مجموعات البيانات والجداول في Big Query
  4. الاستعلام عن بيانات Udemy في محرك استعلام Big Query SQL

تم نشر هذه المقالة كجزء من مدونة علوم البيانات.

جدول المحتويات

وصف المشروع

يهدف هذا المشروع إلى تطوير مستودع بيانات لاستكشاف اتجاهات ورؤى دورة Udemy باستخدام Google Big Query ، والتي ستساعدنا على تحديد أشياء مثل تصنيف الدورات بناءً على المسميات الوظيفية للمدرس ، ومتوسط ​​التقييم لجميع الدورات التدريبية للمعلم ، وما إلى ذلك. سنأخذ دورات Udemy وبيانات المدرب من Kaggle وننزلها على أجهزتنا المحلية. البيانات التي تم تنزيلها من Kaggle بتنسيق CSV.

الآن ، سننشئ الجدول داخل مجموعة البيانات في محرك استعلام Google Cloud Platform SQL من البيانات التي تم تنزيلها. بعد إنشاء الجدول ، سنقوم بتنسيق مخطط الجدول وإجراء تنظيف البيانات. يمكننا إجراء الاستعلام عن البيانات المستوردة لتوليد رؤى مفيدة مثل تصنيف الدورات بناءً على المسميات الوظيفية للمدرس ، وتحديد الدورات ذات الحد الأقصى من التقييمات ، والمدرسين الذين حصلت دوراتهم التدريبية على تقييمات جيدة ، وما إلى ذلك.

حاليًا ، لدينا بيانات من مصدر واحد فقط ، ونحن نستورد بيانات تنسيق CSV من خلال العرض المجمع باستخدام واجهة Google Cloud Platform UI. يمكننا أيضًا استيراد البيانات من مصادر متعددة مثل Cloud Storage و Azure Storage Account وما إلى ذلك. بصرف النظر عن استيراد البيانات من خلال واجهة Google Cloud Platform UI ، يمكن للمستخدمين أيضًا استيراد البيانات باستخدام CLI و REST APIs ، باستخدام خيارات مسار البيانات مثل Cloud Dataflow و Cloud Dataproc وما إلى ذلك ، يدعم Google Big Query أيضًا تنسيقات الملفات مثل Parquet و Avro وما إلى ذلك ، لتحميل البيانات ومعالجتها. يمكن للمطورين أيضًا حفظ الاستعلامات ومشاركتها وتشغيلها في محرك استعلام SQL في الوقت المحدد.

"

من خلال الاستعلام عن بيانات Udemy ، يمكن للمستخدمين تحديد الدورات التي يجب عليهم شراؤها بناءً على مدة الدورة ، وتقييمات الدورة التدريبية ، والمسميات الوظيفية للمدرس ، وشعبية الدورة التدريبية ، وما إلى ذلك. يمكن للمستخدمين حفظ هذه الاستعلامات ومشاركتها. يمكن للمستخدمين أيضًا حفظ نتائج طلبات البحث هذه لإنشاء لوحات معلومات باستخدام Power BI و Looker Studio و Tableau وما إلى ذلك. يمكن للمستخدمين أيضًا استخراج المزيد من البيانات من Udemy باستخدام تقنيات كشط الويب واستيعابها في محرك استعلام Google Big Query SQL للحفاظ على البيانات محدثة حتى يتمكن المستخدمون من الحصول على نتائج أكثر دقة.

المشكلة بيان

في هذه المقالة ، سنستخدم مجموعة بيانات Udemy Course Data 2023 من Kaggle لتطوير مستودع بيانات لاستكشاف اتجاهات ورؤى دورة Udemy باستخدام Google Big Query ، والتي ستساعدنا في تحديد أشياء مثل تصنيف الدورات بناءً على المسميات الوظيفية للمدرس ، متوسط ​​التقييم لجميع دورات المعلم ، وتصنيف الدورات بناءً على عدد المحاضرات في الدورة ، وتحديد الدورات المنشورة والمعدلة مؤخرًا على Udemy ، إلخ.

كما تمت مناقشته بالفعل ، يمكننا استخراج المزيد من البيانات من Udemy باستخدام تقنيات تجريف الويب حيث تستمر الدورات التدريبية والمدربون الجدد في النمو على منصة Udemy. سننشئ جداول داخل مجموعة البيانات في محرك استعلام Google Cloud Platform SQL لاستيراد الدورات وبيانات المعلم التي تم تنزيلها من Kaggle. بعد إنشاء الجدول ، سنقوم بتنظيف البيانات وتنسيق مخطط الجدول.

المشكلة بيان

يمكننا حفظ الاستعلامات ومشاركتها وتشغيلها في محرك استعلام SQL في الوقت المحدد. بصرف النظر عن هذا ، يمكننا أيضًا حفظ نتائج تنفيذ الاستعلام بحيث يمكن استخدامها لإنشاء لوحات معلومات باستخدام Power BI و Looker Studio و Tableau وما إلى ذلك. يهدف هذا المشروع إلى تطوير مستودع بيانات باستخدام بيانات Udemy والاستعلام عن المستخدمين يمكنه تحديد الدورات التي تم نشرها وتعديلها مؤخرًا على Udemy ، وتصنيف الدورات بناءً على مدة الدورة وتقييماتها ، وتحديد متوسط ​​التقييمات لجميع دورات المعلم ، وتصنيف الدورات بناءً على عدد المحاضرات في الدورة ، وما إلى ذلك.

المتطلبات الأساسية المسبقة

فيما يلي بعض المتطلبات الأساسية للقيام بهذا المشروع:

  1. فهم مستودع البيانات: في هذا المشروع ، سننشئ مستودع بيانات لاستكشاف اتجاهات ورؤى دورة Udemy باستخدام Google Big Query. لذلك ، من المهم فهم ماهية مستودع البيانات ، ولماذا يكون مستودع البيانات مفيدًا ، وما يوفره مستودع البيانات من قبل بائعي السحابة المختلفين ، وما إلى ذلك.
  2. تجربة مع Google Cloud Platform: سنستخدم Google Big Query ، وهي خدمة مستودع بيانات متاحة داخل Google Cloud Platform. لذلك ، تعد تجربة Google Cloud Platform مهمة للتنقل بسهولة في النظام الأساسي وفهم عملية إنشاء الموارد والأدوار وأذونات الوصول ، وما إلى ذلك.
  3. تجربة مع استعلامات SQL: سنقوم بكتابة استعلامات في محرك استعلام SQL لتوليد رؤى مفيدة ، مثل تصنيف الدورات بناءً على المسميات الوظيفية للمدرس ، وتحديد الدورات التي حصلت على أقصى درجات التقييم ، والمدرسين الذين حصلت دوراتهم التدريبية على تقييمات جيدة ، وما إلى ذلك.
  4. الإلمام بـ Udemy و Kaggle: سيكون فهم ماهية Kaggle ، ومدى فائدته في تنزيل مجموعات البيانات ، والإلمام الأساسي بمنصة التعلم عبر الإنترنت Udemy مفيدًا أثناء تطوير المشروع.
  5. فهم Google Big Query: نظرًا لأن هذا المشروع يستخدم Google Big Query لإنشاء مستودع بيانات ، فسيكون من المفيد أن يكون لديك فهم لعمليات ومفاهيم وتقنيات البيانات الشائعة في Google Big Query.

معرفة مجموعة البيانات

في هذه المقالة سوف نستخدم بيانات دورات Udemy 2023 بيانات من Kaggle. يمكن تنزيل مجموعة البيانات من خلال زيارة https://www.kaggle.com/datasets/ankushbisht005/udemy-courses-data-2023. الهدف من استخدام مجموعة البيانات هذه هو تحديد الدورات التي تم نشرها وتعديلها مؤخرًا على Udemy ، وتصنيف الدورات بناءً على مدة الدورة وتقييمات الدورة ، وتحديد متوسط ​​التقييمات لجميع دورات المدرب ، وتصنيف الدورات بناءً على عدد المحاضرات في الدورة التدريبية ، إلخ.

تحتوي مجموعة بيانات 2023 الخاصة بدورات Udemy على ملفين باسم course.csv و instructors.csv. يحتوي course.csv على معلومات تتعلق بدورات Udemy. يحتوي ملف Instructors.csv على المعلومات المتعلقة بمعلمي Udemy. يحتوي ملف course.csv على 11 عمودًا و 83,105 صفًا. يحتوي ملف Instructors.csv على 10 أعمدة و 32,234 صفًا. يحتوي ملف course.csv على عمود "معرف_المعلم" ، والذي يعطي معرف مدرس الدورة التدريبية. يُستخدم العمود معرِّف_مدرسين لتكوين العلاقة بين course.csv و instructors.csv.

معرفة مجموعة البيانات

دورات. csv يحتوي على المعرف الفريد للدورة ، وعنوان الدورة ، وتقييم الدورة ، ومدة الدورة ، وعدد المحاضرات في دورة Udemy ، وعنوان URL للدورة ، وتاريخ إنشاء الدورة ، وتاريخ آخر تعديل للدورة ، عدد مراجعات الدورة ومعرف مدرس الدورة. ال Instructors.csv يحتوي على المعرف الفريد للمدرس ، واسم مدرس الدورة ، واسم عرض مدرس الدورة ، ولقب مدرس الدورة ، والمسمى الوظيفي لمعلم الدورة ، وفئة المعلم ، وعنوان URL للمدرس ، والأحرف الأولى من مدرس الدورة ، صورة 50 × 50 للمدرب وصورة 100 × 100 للمدرب. لمعرفة المزيد حول مجموعة البيانات ، قم بزيارة https://www.kaggle.com/datasets/ankushbisht005/udemy-courses-data-2023.

نهج المشروع

في هذا المشروع ، سوف نستخدم بيانات دورات Udemy 2023 مجموعة بيانات من Kaggle لتطوير مستودع بيانات لاستكشاف اتجاهات ورؤى دورة Udemy باستخدام Google Big Query ، والتي ستساعدنا على تحديد أشياء مثل تصنيف الدورات بناءً على المسميات الوظيفية للمعلم ، ومتوسط ​​تقييم جميع دورات المعلم ، وتصنيف الدورات بناءً على عدد المحاضرات في الدورة ، وتحديد الدورات المنشورة والمعدلة مؤخرًا على Udemy ، إلخ.

اتبع الخطوات التالية لإنشاء مستودع بيانات باستخدام بيانات دورات Udemy 2023 مجموعة البيانات من Kaggle:

الخطوة 1: أنشئ مشروعًا جديدًا باستخدام Big Query Sandbox

للعمل مع Google Big Query ، يمكن للمطورين إما إنشاء حساب على Google Cloud Platform أو استخدام Google Big Query Sandbox. سأستخدم Google Big Query Sandbox في هذه المقالة لإنشاء مستودع بيانات. يستخدم المشروع لتنظيم جميع موارد Google السحابية في GCP. باستخدام إدارة الهوية والوصول ، يمكننا تحديد المستخدم المصرح له بالوصول إلى الموارد الموجودة في المشروع.

قم بزيارة الرابط أدناه لاستخدام وضع الحماية للاستعلام الكبير من Google: https://console.cloud.google.com/bigquery

الآن ، اتبع الخطوات الموضحة أدناه:

1. انقر فوق مشروع جديد ، ثم أدخل اسم المشروع كـ Udemy-Project والموقع على الشاشة التالية. انقر فوق إنشاء.

الخطوة 1: أنشئ مشروعًا جديدًا باستخدام Big Query Sandbox
"

2. تم إنشاء مشروع Udemy بنجاح. حدد Udemy-Project لعرض المشروع وإدارة أذونات المستخدم والموارد داخل المشروع.

استعلام Google الكبير | اتجاهات

الخطوة 2: قم بتنزيل مجموعة البيانات من Kaggle واحفظها على الجهاز المحلي

قم بزيارتنا https://www.kaggle.com/datasets/ankushbisht005/udemy-courses-data-2023 وانقر فوق تنزيل. بعد فك ضغط ملف zip الذي تم تنزيله ، ستجد ملفين CSV باسم course.csv و instructors.csv. يحتوي course.csv على معلومات تتعلق بدورات Udemy. يحتوي ملف Instructors.csv على المعلومات المتعلقة بمعلمي Udemy. يحتوي ملف course.csv على 11 عمودًا و 83,105 صفًا. يحتوي ملف Instructors.csv على 10 أعمدة و 32,234 صفًا. يُستخدم العمود معرِّف_مدرسين لتكوين العلاقة بين course.csv و instructors.csv.

جوجل الاستعلام الكبير

الخطوة 3: إنشاء مجموعة بيانات داخل مورد Google Big Query

اتبع الخطوات الموضحة أدناه لإنشاء مجموعة بيانات داخل Google Big Query:

1. حدد اسم المشروع -> Big Query في بطاقة الموارد -> انقر فوق إنشاء مجموعة بيانات.

جوجل الاستعلام الكبير

2. قم بتوفير Udemy_dataset كمعرف مجموعة البيانات ، واختر المنطقة في نوع الموقع ، واختر Asia-south1 (مومباي) كمنطقة ، وقم بتمكين انتهاء صلاحية الجدول.

"

3. انقر فوق إنشاء مجموعة البيانات

إنشاء مجموعة البيانات

الخطوة 4: قم بإنشاء جداول في Dataset Inside Google Big Query Resource

اتبع الخطوات الموضحة أدناه لإنشاء جداول في مجموعة البيانات داخل Google Big Query:

1. حدد مجموعة بيانات Udemy_dataset -> إنشاء جدول

الاتجاهات

2. اختر إنشاء جدول من التحميل ، وحدد ملف course.csv الذي تم تنزيله من Kaggle ، وحدد تنسيق ملف بتنسيق CSV ، وقدم الدورات كاسم جدول ، والجدول الأصلي كنوع جدول ، واختر تلقائي للكشف في المخطط ، والقسم والمجموعة الإعدادات حسب متطلباتنا. في الخيارات المتقدمة ، قم بتوفير 1 في صفوف الرأس لتخطي واختيار التشفير المناسب وفقًا للمتطلبات. انقر فوق إنشاء جدول.

استعلام Google الكبير

3. الآن ، حدد مجموعة بيانات Udemy_dataset مرة أخرى
-> إنشاء الجدول. اختر إنشاء جدول من التحميل ، وحدد ملف instructors.csv الذي تم تنزيله من Kaggle ، وحدد تنسيق الملف كـ CSV ، وقم بتوفير المدرسين كاسم الجدول ، والجدول الأصلي كنوع للجدول ، واختر تلقائي للكشف في المخطط ، وإعدادات القسم والمجموعة حسب متطلباتنا. في الخيارات المتقدمة ، قم بتوفير 1 في صفوف الرأس لتخطي واختيار التشفير المناسب وفقًا للمتطلبات. انقر فوق إنشاء جدول.

"

الخطوة 5: التحقق من مخطط الجداول ومعاينة البيانات

انتقل إلى جدول الدورات التدريبية ، وتحقق من اسم الحقل ونوعه ووضعه في ملف مخطط فاتورة غير مدفوعة. اعرض سياسات الوصول إلى الصفوف لجدول الدورات التدريبية وقم بتحرير مخطط الجدول ، إذا لزم الأمر. عرض معلومات الجدول في المواصفات علامة التبويب وتحرير التفاصيل في حالة التصحيح. يمكننا أيضًا معاينة البيانات ونسخها وتحديثها ومشاركتها. وبالمثل ، انتقل إلى جدول المدرسين ، وتحقق من اسم الحقل ونوعه ووضعه في ملف مخطط فاتورة غير مدفوعة. اعرض سياسات الوصول إلى الصفوف لجدول المدرسين وقم بتحرير مخطط الجدول إذا لزم الأمر.

"
"

لمشاهدة 5000 سجل من دورات الجدول ، قم بتنفيذ الاستعلام أدناه في محرك استعلام SQL:

SELECT * FROM `udemy-project-381211.Udemy_dataset.courses` LIMIT 5000
الاتجاهات

لمشاهدة 5000 سجل من المدربين الجدول ، قم بتنفيذ الاستعلام أدناه في محرك استعلام SQL:

SELECT * FROM `udemy-project-381211.Udemy_dataset.instructors` LIMIT 5000
الاتجاهات

ج: ابحث عن عنوان جميع الدورات التي يزيد تصنيفها عن 4.5 وقد منح أكثر من 10000 شخص تصنيفًا لهذه الدورات. اعرض هذه الدورات بترتيب تنازلي لتصنيفات الدورة وتاريخ إنشائها.

SELECT title AS course_title FROM `udemy-project-381211.Udemy_dataset.courses` WHERE rating>4.5 and num_reviews>10000
ORDER BY rating DESC, created DESC
"

ب. ابحث عن تفاصيل 10 دورات Udemy التي تم إنشاؤها حديثًا.

SELECT * FROM `udemy-project-381211.Udemy_dataset.courses` ORDER BY created DESC
LIMIT 10
استعلام Google الكبير

ج- ابحث عن تفاصيل دورات Udemy العشر التي تم تعديلها مؤخرًا.

SELECT * FROM `udemy-project-381211.Udemy_dataset.courses` ORDER BY last_update_date DESC
LIMIT 10
"

د. ابحث عن تفاصيل دورات JavaScript التي تزيد تقييماتها عن 4 وقد منح أكثر من 20000 شخص تصنيفًا لهذه الدورات.

SELECT * FROM `udemy-project-381211.Udemy_dataset.courses` WHERE title LIKE '%JavaScript%' AND
rating>4 AND num_reviews>20000
"

E. اعرض العنوان والتقييم وعدد المحاضرات الخاصة بدورات Udemy React التي تحتوي على أكثر من 50 محاضرة مكونة من دورة.

SELECT title AS course_title, rating AS course_rating, num_published_lectures as course_lectures FROM `udemy-project-381211.Udemy_dataset.courses` WHERE title LIKE '%React%' AND
num_published_lectures>50
"

و. ابحث عن عدد الدورات واسم مدرس الدورة الذي طوره معلمو الدورة بتقديرات أعلى من متوسط ​​تقييمات الدورات.

SELECT COUNT(courses.id), instructors.name
FROM `Udemy_dataset.instructors` instructors
LEFT JOIN `Udemy_dataset.courses` courses
ON instructors.id = courses.instructors_id
WHERE courses.instructors_id IN (SELECT instructors_id FROM `Udemy_dataset.courses` WHERE rating >(SELECT AVG(rating) FROM `Udemy_dataset.courses`))
GROUP BY instructors.name
"

عرض اسم مدرس الدورة التدريبية والمسمى الوظيفي لدورات Udemy التي تم إنشاؤها بواسطة الأشخاص المسمى الوظيفي لهم مطور ويب
والذين تكون تقييماتهم في الدورة التدريبية أكبر من 4.2.

SELECT instructors.display_name, courses.title as course_title
FROM `Udemy_dataset.instructors` instructors
LEFT JOIN `Udemy_dataset.courses` courses
ON instructors.id = courses.instructors_id
WHERE instructors.job_title LIKE '%Web developer%' and courses.rating>4.2
الاتجاهات

عرض عنوان الدورة واسم مدرس الدورة والتقديرات ومدة الدورة لدورات Udemy حيث تكون مدة الدورة أكبر من 40 دقيقة أو 40 ساعة أو 40 سؤالاً.

SELECT courses.title as course_title, instructors.display_name as course_instructor, courses.rating, courses.duration
FROM `Udemy_dataset.instructors` instructors
LEFT JOIN `Udemy_dataset.courses` courses
ON instructors.id = courses.instructors_id
WHERE CASE WHEN courses.duration LIKE '%.%' THEN CAST(LEFT(courses.duration, STRPOS(courses.duration,'.')-1) AS FLOAT64)>40 WHEN courses.duration LIKE '%total%' THEN CAST(LEFT(courses.duration, STRPOS(courses.duration,'t')-1) AS FLOAT64)>40 WHEN courses.duration LIKE '%ques%' THEN CAST(LEFT(courses.duration, STRPOS(courses.duration,'q')-1) AS FLOAT64)>40
END
"

XNUMX. اعرض اسم مدرس الدورة التدريبية وعنوان دورات Udemy التي تم إنشاؤها بواسطة مطورين معتمدين.

SELECT courses.title as course_title, instructors.display_name as course_instructor
FROM `Udemy_dataset.instructors` instructors LEFT JOIN `Udemy_dataset.courses` courses
ON instructors.id = courses.instructors_id
WHERE instructors.job_title LIKE '%certified%'
استعلام Google الكبير

J. ابحث عن جميع المسميات الوظيفية المميزة لمدرسي دورة Udemy.

SELECT DISTINCT instructors.job_title
FROM `Udemy_dataset.instructors` instructors
استعلام Google الكبير | اتجاهات

ك. ابحث عن العنوان ، والتقييمات ، والمدرس لجميع الدورات التي تزيد تقييماتها عن 4 ، وقد منح أكثر من 17000 شخص تصنيفًا لهذه الدورات. اعرض هذه الدورات بترتيب تنازلي لتقديرات الدورة.

SELECT courses.title as course_title, instructors.display_name as course_instructor, courses.rating
FROM `Udemy_dataset.instructors` instructors
LEFT JOIN `Udemy_dataset.courses` courses
ON instructors.id = courses.instructors_id
WHERE courses.rating > 4 and courses.num_reviews > 17000
ORDER BY courses.rating DESC
استعلام Google الكبير | اتجاهات

L. ابحث عن تفاصيل دورات Azure Udemy العشرين التي تم إنشاؤها حديثًا.

SELECT * FROM `udemy-project-381211.Udemy_dataset.courses` WHERE title LIKE '%Azure%'
ORDER BY created DESC
LIMIT 20
استعلام Google الكبير

M. ابحث عن تفاصيل الدورات التدريبية الـ 15 التي تم إنشاؤها حديثًا من AWS Udemy.

SELECT * FROM `udemy-project-381211.Udemy_dataset.courses` WHERE title LIKE '%AWS%'
ORDER BY created DESC
LIMIT 15
استعلام Google الكبير | اتجاهات

N. عرض جميع تفاصيل دورات Udemy SAS التي تحتوي على محاضرات بين 112 و 156 بترتيب متزايد لعنوان الدورة.

SELECT * FROM `udemy-project-381211.Udemy_dataset.courses` WHERE title LIKE '%SAS %' AND
num_published_lectures BETWEEN 112 AND 156
ORDER BY title
استعلام Google الكبير

O. اعرض اسم مدرس الدورة التدريبية ، والمسمى الوظيفي ، والتصنيفات ، ومراجعات الدورة التدريبية لأفضل دورتين دراسيتين في Udemy Azure Data Factory بناءً على تقييمات الدورة التدريبية وعدد مراجعات الدورة التدريبية.

SELECT courses.title as course_title, instructors.display_name as course_instructor, courses.rating, courses.num_reviews
FROM `Udemy_dataset.instructors` instructors
LEFT JOIN `Udemy_dataset.courses` courses
ON instructors.id = courses.instructors_id
WHERE courses.title LIKE '%Azure Data Factory %'
ORDER BY courses.num_reviews DESC, courses.rating DESC LIMIT 2
استعلام Google الكبير

P. اعرض اسم مدرس الدورة التدريبية والمسمى الوظيفي والتصنيفات ومراجعات الدورة التدريبية لأفضل دورة Udemy Salesforce استنادًا إلى تقييمات الدورة التدريبية وعدد مراجعات الدورة التدريبية.

SELECT courses.title as course_title, instructors.display_name as course_instructor, courses.rating, courses.num_reviews
FROM `Udemy_dataset.instructors` instructors
LEFT JOIN `Udemy_dataset.courses` courses
ON instructors.id = courses.instructors_id
WHERE courses.title LIKE '%Salesforce %'
ORDER BY courses.num_reviews DESC, courses.rating DESC LIMIT 1
استعلام Google الكبير

مما سبق ، نعرف كيفية إنشاء مستودع بيانات لاستكشاف اتجاهات ورؤى دورة Udemy باستخدام جوجل الاستعلام الكبير. فيما يلي بعض الاتجاهات والرؤى الرئيسية التي تم اكتشافها أثناء استكشاف بيانات دورات Udemy:

1. دورات JavaScript التدريبية الأكثر شيوعًا لها متوسط ​​تقييم أكبر من 4.6.

2. تم إنشاء 34 دورة Udemy فقط من قبل المدرسين الذين يكون مسمى وظيفتهم هو مطور ويب وتكون تقييمات دوراتهم التدريبية أكبر من 4.2.

3. تم إنشاء ما يقرب من 150 دورة تدريبية من Udemy بواسطة مطورين معتمدين من AWS أو Azure أو GCP أو Salesforce.

4. أنشأ راميش رتناسامي أشهر دورة لمصنع بيانات أزور في Udemy.

5. تحظى دورات Azure و AWS التي تم إنشاؤها مؤخرًا بشعبية كبيرة على Udemy.

6. يفضل مستخدمو Udemy التسجيل في دورات SAS بحوالي 100-150 محاضرة بتقديرات جيدة.

وفي الختام

في هذه المقالة ، رأينا كيفية إنشاء مستودع بيانات لاستكشاف اتجاهات ورؤى دورة Udemy باستخدام Google Big Query. يخزن مستودع البيانات ويحلل كمية كبيرة من البيانات وينتج رؤى مفيدة للبيانات بمساعدة تصورات البيانات والتقارير. لقد رأينا كيفية إنشاء جدول عن طريق استيراد البيانات من Kaggle في Google Big Query. نحن نفهم أيضًا كيفية إنشاء العلاقات بين الجداول لفهم البيانات بشكل أفضل. نظرنا في كيفية تحليل البيانات بمساعدة الاستعلامات للحصول على رؤية مفيدة من البيانات. فيما يلي النقاط الرئيسية من المقالة أعلاه:

  1. لقد رأينا كيف يمكننا إنشاء جداول في Google Big Query.
  2. لقد فهمنا كيفية الاستعلام عن البيانات في محرك استعلام Big Query SQL.
  3. لقد حددنا أيضًا تفاصيل دورات Udemy التي أنشأها الأشخاص الذين يكون مسمى وظيفتهم مطور ويب والذين تزيد تقييمات دوراتهم عن 4.2.
  4. لقد رأينا أيضًا عدد الدورات التدريبية على Udemy التي تم إنشاؤها بواسطة مطورين معتمدين.
  5. لقد توصلنا إلى دورات Azure و AWS التي تم إنشاؤها حديثًا على أساس اتجاهات Udemy.
  6. بصرف النظر عن ذلك ، رأينا أيضًا اتجاهات أخرى للدورة التدريبية على Udemy من خلال استكشاف بيانات Udemy داخل محرك استعلام SQL.

الوسائط الموضحة في هذه المقالة ليست مملوكة لـ Analytics Vidhya ويتم استخدامها وفقًا لتقدير المؤلف. 

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة