Logo Zéphyrnet

7 micro-cours Kaggle gratuits pour les débutants en science des données – KDnuggets

Date :

7 micro-cours Kaggle gratuits pour les débutants en science des données
Image par auteur
 

Vous souvenez-vous d'un cours de science des données auquel vous vous êtes inscrit mais que vous n'avez jamais réussi à terminer ? Eh bien, vous n'êtes pas seul.

La plupart des débutants en science des données s'inscrivent à un ou plusieurs cours : gratuits ou payants. Mais comme les cours de science des données couvrent généralement un large éventail de sujets (de la programmation à l'analyse des données, en passant par la visualisation, etc.), il faut plusieurs semaines pour les aborder. Et même s’ils commencent fort, la plupart des apprenants commencent à se sentir dépassés après les premiers modules et ne parviennent pas à progresser. Entrez dans les (micro)cours Kaggle. 

La série de micro-cours de Kaggle sont une bonne alternative si vous trouvez les cours plus longs plus difficiles à suivre. Ce sont d'excellentes ressources pour acquérir des compétences en science des données (Python, pandas, apprentissage automatique, etc.) sans se sentir dépassé. Les cours sont conçus de manière à ne prendre que quelques heures et comprennent des éléments de didacticiel et de pratique. Passons maintenant en revue quelques cours adaptés aux débutants et ce qu'ils couvrent.

Python est l'un des langages les plus utilisés en science des données. En plus de vous aider dans votre carrière dans le domaine des données, Python est également utile si vous souhaitez vous lancer dans le génie logiciel à un moment donné. Le cours Python sur Kaggle vous aidera à apprendre les éléments suivants :

  • Bases de Python (syntaxe et variables) 
  • Les fonctions 
  • Booléens et conditionnels 
  • Listes, boucles et compréhensions de listes 
  • Chaînes et dictionnaires 
  • Travailler avec des bibliothèques externes

Si vous sentez que vous avez besoin d'une introduction encore plus simple à la programmation avant de vous lancer dans Python, vous pouvez consulter le introduction à la programmation cours.

Étant donné que les cours suivants sur Pandas et la visualisation de données nécessitent que vous soyez à l'aise avec le contenu de ce cours, vous ne devez pas sauter le cours Python si vous débutez dans la programmation avec Python.

Lien : Apprenez Python

Une fois que vous êtes familiarisé avec Python de base, vous pouvez apprendre les pandas, une puissante bibliothèque d'analyse et de manipulation de données.

Grâce à une série de courtes leçons et d'exercices pratiques de codage, le pandas vous aidera à apprendre à effectuer les opérations suivantes sur les dataframes pandas :

  • Créer, lire et écrire 
  • Indexation, sélection et attribution 
  • Renommer et combiner 
  • Fonctions récapitulatives et cartes 
  • Regroupement et tri 
  • Types de données et valeurs manquantes

Lien : Apprendre les pandas

Maintenant que vous savez analyser des données avec Python et Pandas, il est temps de tirer parti de ces connaissances en apprenant à visualiser vos données.

La Visualisation de données Le cours couvre les bases de la création de tracés et de graphiques utiles à l'aide de la bibliothèque Python Seaborn. Le cours couvre les éléments suivants :

  • Graphiques en ligne 
  • Graphiques à barres et cartes thermiques 
  • Nuages ​​de points
  • Histogrammes et tracés de densité 
  • Choisir les types de parcelles 

Vous devez également travailler sur un projet final pour appliquer ce que vous avez appris.

Lien : Apprendre la visualisation des données

SQL est la compétence la plus essentielle en science des données que vous puissiez acquérir. Pour comprendre pourquoi SQL est extrêmement important pour la science des données, lisez "Pourquoi SQL est le langage à apprendre pour la science des données" par Nate Rosidi, contributeur de KDnuggets.

La Introduction à SQL Le cours vous apprendra comment interroger des ensembles de données avec SQL à l'aide du client BigQuery Python et couvrira les principes fondamentaux de SQL, le filtrage et l'écriture de requêtes SQL lisibles :

  • Premiers pas avec SQL et BigQuery 
  • Sélectionner, depuis et où 
  • Regrouper par, avoir et compter 
  • Commandé par 
  • Au fur et à mesure 
  • Joindre des données 

Lien : Apprendre l'introduction à SQL

Maintenant que vous êtes à l'aise avec les bases de SQL, vous pouvez suivre SQL avancé cours pour développer davantage vos compétences SQL. Ce cours s'appuie sur le cours d'introduction à SQL et couvre les sujets suivants sur la combinaison de données de plusieurs tables et l'exécution d'opérations plus complexes :

  • Adhésions et syndicats 
  • Fonctions analytiques 
  • Données imbriquées et répétées
  • Rédiger des requêtes efficaces

Lien : Apprendre le SQL avancé

Si vous avez déjà suivi les cours ci-dessus, vous devriez être à l'aise avec la programmation et l'analyse de données avec Python et SQL. Vous êtes maintenant prêt à vous lancer dans l’apprentissage automatique.

La Introduction à l'apprentissage automatique le cours couvre :

  • Comment fonctionnent les modèles ML 
  • Exploration de données de base 
  • Validation du modèle 
  • Sous-apprentissage et surapprentissage 
  • Forêts aléatoires 

Vous pouvez également soumettre une candidature à un concours Kaggle adapté aux débutants.

Lien : Apprenez l’introduction à l’apprentissage automatique 

La Apprentissage automatique intermédiaire Le cours s'appuie sur le cours d'introduction à l'apprentissage automatique et vous apprend à gérer les valeurs manquantes, les variables catégorielles et à éviter le problème délicat de la fuite de données lors de la formation de modèles d'apprentissage automatique.

Les sujets abordés comprennent :

  • Valeurs manquantes 
  • Variables catégorielles 
  • Pipelines de ML 
  • Validation croisée 
  • XGBoost 
  • Fuite de données

Lien : Apprentissage automatique intermédiaire

J'espère que vous avez trouvé cette synthèse de cours utile. 

Comme mentionné, ils sont tous gratuits. Et cela ne prend que quelques heures pour acquérir une compétence essentielle en science des données. Vous pouvez ainsi commencer votre parcours en science des données un micro-cours à la fois. Bon apprentissage!
 
 

Bala Priya C est un développeur et rédacteur technique indien. Elle aime travailler à l'intersection des mathématiques, de la programmation, de la science des données et de la création de contenu. Ses domaines d'intérêt et d'expertise incluent DevOps, la science des données et le traitement du langage naturel. Elle aime lire, écrire, coder et prendre un café ! Actuellement, elle travaille à l'apprentissage et au partage de ses connaissances avec la communauté des développeurs en créant des didacticiels, des guides pratiques, des articles d'opinion, etc.

spot_img

Dernières informations

spot_img