Zephyrnet-logo

5 gratis boeken om statistieken voor datawetenschap onder de knie te krijgen – KDnuggets

Datum:

5 gratis boeken om statistieken voor datawetenschap onder de knie te krijgen
Afbeelding door redacteur
 

Om data science te leren, heb je ook een solide basis in wiskunde nodig. En statistiek is een van die essentiële wiskundige vaardigheden voor datawetenschap. 

Het leren van statistiek kan echter intimiderend zijn, vooral als je een specialisatie hebt die geen wiskunde of informatica is. Om u op weg te helpen, hebben we een lijst met gratis boeken samengesteld die statistieken voor datawetenschap toegankelijk maken.

De meeste van deze boeken gaan uit van een praktische benadering van statistische concepten, wat je nodig hebt om als datawetenschapper statistieken effectief te kunnen gebruiken. Laten we deze statistiekenboeken eens doornemen.

De  Inleidende statistieken boek is een toegankelijke inleiding tot statistiek, waarin wordt behandeld wat een semesterlange inleidende cursus statistiek op hogescholen doorgaans omvat. 

Dit boek is gratis toegankelijk op OpenStax en geschreven door een team van deskundige auteurs. Het hanteert een toepassingsgerichte benadering van statistiek in plaats van een theoriegerichte benadering en bevat voorbeelden in oefeningen voor elk onderwerp. 

Dit boek helpt je het volgende te leren:

  • Bemonstering en gegevens 
  • Beschrijvende statistiek 
  • Onderwerpen in waarschijnlijkheid en willekeurige variabelen 
  • Normale verdeling 
  • De centrale limietstelling 
  • Betrouwbaarheidsintervallen 
  • Hypothese testen 
  • De Chi-kwadraatverdeling
  • Lineaire regressie en correlatie 
  • F-verdeling en one-way ANOVA

Link: Inleidende statistieken 2e

Inleiding tot moderne statistiek is een gratis online leerboek van het OpenIntro-project en is geschreven door auteurs Mine Çetinkaya-Rundel en Johanna Hardin.

Als je de statistische grondslagen voor effectieve data-analyse wilt leren, dan is dit boek iets voor jou. De inhoud van dit boek is als volgt:

  • Inleiding tot gegevens 
  • Verkennende gegevensanalyse 
  • Regressiemodellering 
  • Grondslagen van gevolgtrekking 
  • Statistische gevolgtrekking 
  • Inferentiële modellering

Link: Inleiding tot moderne statistiek

Denkstatistieken door Allen B. Downey helpt je bij het leren en oefenen van statistische concepten met behulp van Python. 

U kunt dus uw Python-vaardigheden toepassen om statistieken en waarschijnlijkheidsconcepten te leren, zodat u effectief met gegevens kunt werken. Terwijl je het boek doorwerkt, kun je korte Python-programma's schrijven en oefenen met echte datasets om je begrip van statistische concepten te versterken.

De onderwerpen die aan bod komen zijn als volgt:

  • Verkennende gegevensanalyse 
  • Distributie 
  • Waarschijnlijkheidsmassafuncties 
  • Cumulatieve verdelingsfuncties 
  • Het modelleren van distributies 
  • Kansdichtheidsfuncties 
  • Relaties tussen variabelen 
  • Schatting 
  • Hypothese testen 
  • Lineaire kleinste kwadraten 
  • Regressie 
  • Overlevingsanalyse 
  • Analytische methoden

Link: Denk aan statistieken 2e

Computationeel en inferentieel denken: de grondslagen van datawetenschap door Ani Adhikari, John DeNero en David Wagner zullen u helpen de statistische grondslagen voor datawetenschap te leren. 

Dit boek is ontwikkeld als aanvulling op de Gegevens 8: Grondslagen van datawetenschap cursus aangeboden aan UC Berkeley. De onderwerpen die in dit boek aan bod komen zijn onder meer:

  • Inleiding tot data science 
  • Programmeren in Python 
  • Gegevenstypen, reeksen en tabellen
  • Visualisatie
  • Functies en tabellen
  • Willekeurigheid 
  • Bemonstering en empirische distributie 
  • Hypothese testen 
  • Schatting 
  • Regressie 
  • Classificatie

Link: Computationeel en inferentieel denken: de grondslagen van datawetenschap

Probabilistisch programmeren en Bayesiaanse methoden voor hackers of Bayesiaanse methoden voor hackers is een populair boek over Bayesiaanse methoden in de statistiek.

“Bayesiaanse methoden voor hackers”: een inleiding tot Bayesiaanse methoden + probabilistisch programmeren vanuit een gezichtspunt van rekenen/begrijpen en vervolgens van wiskunde. Alles in pure Python 😉 

 

- bron

Je raakt vertrouwd met de waarschijnlijkheidstheorie en de Bayesiaanse gevolgtrekking terwijl je de PyMC-pakket. De inhoud van dit boek is als volgt:

  • Inleiding tot Bayesiaanse methoden
  • De PyMC-bibliotheek
  • Markov-ketting Monte Carlo
  • De wet van grote aantallen
  • Verliesfuncties
  • Prioren

Link: Probabilistisch programmeren en Bayesiaanse methoden voor hackers

Ik hoop dat je deze verzameling gratis statistiekboeken nuttig vond. De mix van theorie en praktijkgerichte praktijk zou u moeten helpen uw datawetenschapsvaardigheden te verbeteren en beter geïnformeerde beslissingen te nemen bij het werken met grote datasets uit de echte wereld.

Als je liever via gratis cursussen werkt of je leesmateriaal wilt aanvullen met cursussen, kijk dan eens naar 5 gratis cursussen om statistieken voor datawetenschap onder de knie te krijgen.
 
 

Bala Priya C is een ontwikkelaar en technisch schrijver uit India. Ze werkt graag op het snijvlak van wiskunde, programmeren, datawetenschap en contentcreatie. Haar interessegebieden en expertise omvatten DevOps, data science en natuurlijke taalverwerking. Ze houdt van lezen, schrijven, coderen en koffie! Momenteel werkt ze aan het leren en delen van haar kennis met de ontwikkelaarsgemeenschap door het schrijven van tutorials, handleidingen, opiniestukken en meer. Bala maakt ook boeiende bronnenoverzichten en codeertutorials.

spot_img

Laatste intelligentie

spot_img