شعار زيفيرنت

ابحث عن مجموعة بيانات لإطلاق مشروع علوم البيانات ، وضبط تعليم الذكاء الاصطناعى الخاص بك

التاريخ:

اعثر على مجموعة البيانات المناسبة لعلوم البيانات الخاصة بك ، وابدأ العمل بها ، وحافظ على تعليم الذكاء الاصطناعي الخاص بك. (صور جيتي)

بواسطة منظمة العفو الدولية الاتجاهات

بمجرد أن تقرر استكشاف مهنة في علم البيانات ، وتحتاج إلى الانخراط في مشروع لتستمر في العمل ، تحتاج إلى تحديد مجموعة البيانات التي ستستخدمها.

لحسن الحظ ، تم نشر دليل لأفضل مجموعات البيانات للتعلم الآلي في edureka!، بقلم ديشا جوبتا ، كاتبة علوم وتكنولوجيا الكمبيوتر ومقرها الهند. وتشير إلى أنه بدون مجموعات البيانات التدريبية ، لن يكون لخوارزميات التعلم الآلي طريقة لتعلم التنقيب عن النص أو تصنيف النص. منذ خمس إلى عشر سنوات ، كان من الصعب العثور على مجموعات بيانات لمشاريع التعلم الآلي وعلوم البيانات. التحدي اليوم لا يتمثل في العثور على البيانات ، ولكن في العثور على البيانات ذات الصلة.

هنا مقتطف يشير إلى مجموعات البيانات المفيدة لـ معالجة اللغات الطبيعية المشاريع التي تحتاج إلى بيانات نصية. أوصت:

مجموعة بيانات إنرون - بيانات البريد الإلكتروني من الإدارة العليا لشركة Enron والتي يتم تنظيمها في مجلدات.

الأمازون الاستعراضات - يحتوي على ما يقرب من 35 مليون مراجعة من Amazon تمتد على مدار 18 عامًا. تتضمن البيانات معلومات المستخدم ومعلومات المنتج والتقييمات والمراجعة النصية.

تصنيف مجموعة الأخبار - مجموعة تضم ما يقرب من 20,000 مستند مجموعة أخبار ، مقسمة بالتساوي عبر 20 مجموعة أخبار. إنه أمر رائع لممارسة نمذجة الموضوع وتصنيف النص.

في حالة تمويل المشاريع:

Quandl: مصدر كبير للبيانات الاقتصادية والمالية المفيدة لبناء نماذج للتنبؤ بأسعار الأسهم أو المؤشرات الاقتصادية.

العالم البيانات المفتوحة للبنك: يغطي التركيبة السكانية والعديد من المؤشرات الاقتصادية والتنموية في جميع أنحاء العالم.

بيانات صندوق النقد الدولي: ينشر صندوق النقد الدولي (IMF) بيانات حول التمويلات الدولية واحتياطيات النقد الأجنبي ومعدلات الديون وأسعار السلع والاستثمارات.

ولل تحليل المشاعر المشاريع:

مجال متعددة مجموعة بيانات تحليل المشاعر - ميزات مراجعات المنتجات من أمازون.

مراجعات IMDB - مجموعة بيانات لتصنيف المشاعر الثنائية. يضم 25,000 مراجعة للأفلام.

المشاعر 140 - يستخدم 160,000 تغريدة مع حذف رموز المشاعر مسبقًا.

سؤالان لمشروع علوم البيانات الخاص بك

بمجرد تحديد مجموعة البيانات ، قد تحتاج إلى بعض الاقتراحات الإضافية لبدء مشروعك. أولاً ، اسأل نفسك سؤالين ، واقترح مقالة حديثة في علوم البيانات الأسبوعية: كيف يمكنك كسب بعض المال معها؟ وكيف ستوفر بعض المال معها؟

ستساعدك الإجابات على التركيز على ما هو مهم ومفيد عند النظر إلى بياناتك. ستجد غالبًا أنه قبل الوصول إلى النمذجة أو الرياضيات الجادة ، قد تضطر إلى حل مشكلات البيانات ، مثل البيانات المفقودة أو الخاطئة أو المتحيزة. يقول المؤلف: "ستجد كثيرًا في العالم الحقيقي أن البيانات فوضوية بشكل لا يصدق ولا شيء مثل مجموعات البيانات النظيفة الصارمة الموجودة على الإنترنت في المسابقات على Kaggle أو في أي مكان آخر".

ربما تشعر في هذه المرحلة أنك بحاجة إلى مزيد من التعليم حول الذكاء الاصطناعي. لحسن الحظ، BestColleges قد وصل. الشركة عبارة عن شراكة مع HigherEducation.com لتزويد الطلاب باتصالات مباشرة بالمدارس والبرامج التي تناسب أهدافهم التعليمية. يوفر الموقع التخطيط للكلية والوصول إلى المساعدات المالية والموارد الوظيفية.

اعمل على تحسين تعليم الذكاء الاصطناعي الخاص بك

يتطلب النجاح في مجال الذكاء الاصطناعي عادةً الحصول على درجة جامعية في علوم الكمبيوتر أو تخصص ذي صلة مثل الرياضيات. قد تتطلب المزيد من المناصب العليا درجة الماجستير في الدكتوراه. الدافع مهم. صرح دان أيوب ، مدير التعليم في Microsoft ، أن "الفضول والثقة والمثابرة هي سمات جيدة لأي طالب يتطلع إلى اقتحام مجال ناشئ والذكاء الاصطناعي ليس استثناءً". "على عكس المهن التي تم وضع المسار فيها على مدى عقود ، لا يزال الذكاء الاصطناعي في مهده ، مما يعني أنه قد يتعين عليك تشكيل طريقك الخاص والإبداع."

دان أيوب ، مدير عام التعليم ، مايكروسوفت

توضح المقالة عينة من الموضوعات الأساسية في منهج الذكاء الاصطناعي في الرياضيات والإحصاء وعلوم الكمبيوتر و "الذكاء الاصطناعي الأساسي" ، مثل التعلم الآلي والشبكات العصبية ومعالجة اللغة الطبيعية. بمجرد تغطية بعض الأساسيات ، يمكنك البدء في استكشاف الموضوعات التي تهمك شخصيًا. تتضمن المجموعات التعلم الآلي والروبوتات والتفاعل بين الإنسان والذكاء الاصطناعي.

اقترح أيوب ، سواء كنت طالبًا جامعيًا أو تعمل بالفعل ، من المهم تحديد منهج الذكاء الاصطناعي الخاص بك بشكل استباقي.

من الأمثلة على المهارات التي يمكن أن تساعدك في تحديد المربعات الصحيحة في استجابتك لنشر وظيفة الذكاء الاصطناعي ما يلي:

  • لغات البرمجة: Python و Java و C / C ++ و SQL و R و Scala و Perl
  • أطر التعلم الآلي: TensorFlow و Theano و Caffe و PyTorch و Keras و MXNET
  • المنصات السحابية: AWS و Azure و GCP
  • أنظمة إدارة سير العمل: تدفق الهواء ، لويجي ، الكرة والدبابيس
  • أدوات البيانات الضخمة: Spark، HBase، Kafka، HDFS، Hive، Hadoop، MapReduce، Pig
  • أدوات معالجة اللغة الطبيعية: spaCy ، NLTK

تتطلب وظائف المستقبل الرغبة في البقاء فضوليًا. يستغرق بعض الوقت وبعض الصبر.

يشجع أحد باحثي IBM AI الموقف الذي يجب أن يتبناه الذكاء الاصطناعي من قبل المزيد من الأشخاص ذوي مهارات علوم البيانات وهندسة البرمجيات ، حيث يتضاعف الطلب على العمال المهرة في التعلم الآلي كل بضعة أشهر. قال داريو جيل ، مدير الأبحاث في شركة آي بي إم ، في مقال: "إذا تركناه كعالم أسطوري ، هذا المجال من الذكاء الاصطناعي ، يمكن الوصول إليه فقط من قبل حاملي الدكتوراه المختارين الذين يعملون في هذا المجال ، فإنه لا يساهم حقًا في اعتماده". في  VentureBeat.

قراءة المواد المصدر في  edureka!, علوم البيانات الأسبوعية، في BestColleges وفي  VentureBeat.

المصدر: https://www.aitrends.com/education/find-a-dataset-to-launch-your-data-science-project-and-tune-your-ai-education/

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة