Zephyrnet-logo

7 gratis Kaggle-microcursussen voor beginners in datawetenschap – KDnuggets

Datum:

7 gratis Kaggle-microcursussen voor beginners in datawetenschap
Afbeelding door auteur
 

Herinner je je die ene data science-cursus waarvoor je je had aangemeld, maar die je nooit hebt afgerond? Nou, je bent niet de enige.

De meeste data science-beginners schrijven zich in voor een of meer cursussen: gratis of betaald. Maar omdat data science-cursussen doorgaans een breed scala aan onderwerpen bestrijken – van programmeren tot data-analyse, visualisatie en meer – duurt het enkele weken om ze te doorgronden. En zelfs als ze sterk beginnen, voelen de meeste leerlingen zich na de eerste paar modules overweldigd en boeken ze geen vooruitgang. Voer Kaggle (micro)cursussen in. 

De reeks van microcursussen van Kaggle zijn een goed alternatief als je langere cursussen moeilijker kunt doorstaan. Het zijn geweldige hulpmiddelen om vaardigheden op het gebied van datawetenschap te leren (Python, panda's, machine learning en meer) zonder dat u zich overweldigd voelt. De cursussen zijn zo ontworpen dat ze slechts een paar uur in beslag nemen en bevatten tutorial- en oefencomponenten. Laten we nu eens enkele beginnersvriendelijke cursussen bekijken en wat ze behandelen.

Python is een van de meest gebruikte talen in de datawetenschap. Behalve dat het je helpt in je datacarrière, is Python ook nuttig als je ooit wilt beginnen met software-engineering. De Python-cursus op Kaggle helpt je het volgende te leren:

  • Basisprincipes van Python (syntaxis en variabelen) 
  • Functies 
  • Booleans en conditionals 
  • Lijsten, loops en lijstbegrippen 
  • Tekenreeksen en woordenboeken 
  • Werken met externe bibliotheken

Als je het gevoel hebt dat je een nog eenvoudiger introductie tot programmeren nodig hebt voordat je in Python duikt, kun je de inleiding tot programmeren Natuurlijk.

Omdat de vervolgcursussen over Panda's en datavisualisatie vereisen dat je vertrouwd bent met de inhoud van deze cursus, mag je de Python-cursus niet overslaan als je nieuw bent met programmeren met Python.

Link: Leer Python

Als je eenmaal bekend bent met de basis-Python, kun je dat leer panda's, een krachtige bibliotheek voor gegevensanalyse en manipulatie.

Door middel van een reeks korte lessen en praktische codeeroefeningen kan de panda's helpt u bij het leren uitvoeren van de volgende bewerkingen op Panda-dataframes:

  • Creëren, lezen en schrijven 
  • Indexeren, selecteren en toewijzen 
  • Hernoemen en combineren 
  • Overzichtsfuncties en kaarten 
  • Groeperen en sorteren 
  • Gegevenstypen en ontbrekende waarden

Link: Leer Panda's

Nu u weet hoe u gegevens kunt analyseren met Python en panda's, is het tijd om daarop voort te bouwen door te leren hoe u uw gegevens kunt visualiseren.

De Data visualisatie De cursus behandelt de basisprincipes van het maken van nuttige plots en grafieken met behulp van de Python-bibliotheek Seaborn. De cursus omvat het volgende:

  • Lijndiagrammen 
  • Staafdiagrammen en hittekaarten 
  • Spreidingsdiagrammen
  • Histogrammen en dichtheidsplots 
  • Plottypes kiezen 

Je moet ook aan een eindproject werken om het geleerde toe te passen.

Link: Leer datavisualisatie

SQL is de meest essentiële datawetenschapsvaardigheid die u kunt leren. Lees dit artikel om te begrijpen waarom SQL superbelangrijk is voor datawetenschap “Waarom SQL de taal is om te leren voor data science” door KDnuggets-medewerker Nate Rosidi.

De Inleiding tot SQL De cursus leert u hoe u data-ets kunt opvragen met SQL met behulp van de BigQuery Python-client en behandelt de basisprincipes van SQL, filteren en schrijven van leesbare SQL-query's:

  • Aan de slag met SQL en BigQuery 
  • Selecteer, van en waar 
  • Groepeer op, heb en tel 
  • volgorde 
  • Als en met 
  • Samenvoegen van gegevens 

Link: Leer de inleiding tot SQL

Nu u vertrouwd bent met de basisbeginselen van SQL, kunt u de Geavanceerde SQL cursus om uw SQL-vaardigheden verder te ontwikkelen. Deze cursus bouwt voort op de inleiding tot SQL en behandelt de volgende onderwerpen over het combineren van gegevens uit meerdere tabellen en het uitvoeren van complexere bewerkingen:

  • Joins en vakbonden 
  • Analytische functies 
  • Geneste en herhaalde gegevens
  • Efficiënte queries schrijven

Link: Leer geavanceerde SQL

Als je de bovenstaande cursussen al hebt doorlopen, zou je vertrouwd moeten zijn met programmeren en data-analyse met Python en SQL. U bent nu klaar om aan de slag te gaan met machine learning.

De Inleiding tot machinaal leren cursus omvat:

  • Hoe ML-modellen werken 
  • Basisgegevensverkenning 
  • Modelvalidatie 
  • Onderfitting en overfitting 
  • Willekeurige bossen 

Je kunt ook een inzending indienen voor een beginnersvriendelijke Kaggle-wedstrijd.

Link: Leer de introductie tot machine learning 

De Intermediate machine learning De cursus bouwt voort op de cursus Inleiding tot Machine Learning en leert u hoe u omgaat met ontbrekende waarden en categorische variabelen en hoe u het lastige probleem van gegevenslekken vermijdt bij het trainen van machine learning-modellen.

Het behandelde onderwerp omvat onder meer:

  • Ontbrekende waarden 
  • Categorische variabelen 
  • ML-pijplijnen 
  • Kruisvalidatie 
  • XGBoost 
  • Data lekkage

Link: Intermediate machine learning

Ik hoop dat je dit overzicht van cursussen nuttig vond. 

Zoals gezegd zijn ze allemaal gratis. En het duurt maar een paar uur om een ​​essentiële datawetenschapsvaardigheid te leren. U kunt dus microcursus voor microcursus aan uw datawetenschapsreis beginnen. Veel leerplezier!
 
 

Bala Priya C is een ontwikkelaar en technisch schrijver uit India. Ze werkt graag op het snijvlak van wiskunde, programmeren, datawetenschap en contentcreatie. Haar interessegebieden en expertise omvatten DevOps, data science en natuurlijke taalverwerking. Ze houdt van lezen, schrijven, coderen en koffie drinken! Momenteel werkt ze aan het leren en delen van haar kennis met de gemeenschap van ontwikkelaars door het schrijven van zelfstudies, handleidingen, opiniestukken en meer.

spot_img

Laatste intelligentie

spot_img