Zephyrnet-logo

5 gratis bøker for å mestre statistikk for datavitenskap – KDnuggets

Dato:

5 gratis bøker for å mestre statistikk for datavitenskap
Bilde av redaktør
 

For å lære datavitenskap trenger du også et solid grunnlag i matematikk. Og statistikk er en av de essensielle matematiske ferdighetene for datavitenskap. 

Læringsstatistikk kan imidlertid være skremmende, spesielt hvis du kommer fra en spesialisering som ikke er matematikk eller informatikk. For å hjelpe deg i gang har vi satt sammen en liste over gratis bøker som gjør statistikk for datavitenskap tilgjengelig.

De fleste av disse bøkene tar en praktisk tilnærming til statistikkkonsepter, som er det du trenger for å bruke statistikk effektivt som dataforsker. Så la oss gå gjennom disse statistikkbøkene.

De  Innledende statistikk bok er en tilgjengelig introduksjon til statistikk som dekker det et semesterlangt introduksjonskurs i statistikk på høyskoler vanligvis dekker. 

Denne boken er tilgjengelig for gratis tilgang på OpenStax og skrevet av et team av medvirkende ekspertforfattere, og tar en applikasjon-først-tilnærming til statistikk i stedet for en teori-først-tilnærming og inkluderer eksempler i øvelser for hvert emne. 

Denne boken vil hjelpe deg å lære følgende:

  • Prøvetaking og data 
  • Beskrivende statistikk 
  • Emner i Sannsynlighet og tilfeldige variabler 
  • Normal distribusjon 
  • Sentralgrense-teoremet 
  • Tillitsintervaller 
  • Hypotesetesting 
  • Chi-Square-fordelingen
  • Lineær regresjon og korrelasjon 
  • F distribusjon og enveis ANOVA

Link: Innledende statistikk 2e

Introduksjon til moderne statistikk er en gratis nettbasert lærebok fra OpenIntro-prosjektet og er skrevet av forfatterne Mine Çetinkaya-Rundel og Johanna Hardin.

Hvis du vil lære statistikkgrunnlag for effektiv dataanalyse, så er denne boken for deg. Innholdet i denne boken er som følger:

  • Introduksjon til data 
  • Utforskende dataanalyse 
  • Regresjonsmodellering 
  • Grunnlag for slutninger 
  • Statistisk slutning 
  • Inferensiell modellering

Link: Introduksjon til moderne statistikk

Tenk statistikk av Allen B. Downey vil hjelpe deg å lære og øve på statistikkkonsepter ved hjelp av Python. 

Så du kan bruke Python-ferdighetene dine til å lære statistikk og sannsynlighetsbegreper for å jobbe med data effektivt. Etter hvert som du arbeider deg gjennom boken, får du skrive korte Python-programmer og øve deg med ekte datasett for å styrke forståelsen av statistikkkonsepter.

Temaene som dekkes er som følger:

  • Utforskende dataanalyse 
  • Distribusjon 
  • Sannsynlighetsmassefunksjoner 
  • Kumulative distribusjonsfunksjoner 
  • Modellering av distribusjoner 
  • Sannsynlighetstetthetsfunksjoner 
  • Sammenheng mellom variabler 
  • Anslag 
  • Hypotesetesting 
  • Lineære minste kvadrater 
  • Regresjon 
  • Overlevelsesanalyse 
  • Analysemetoder

Link: Tenk Stats 2e

Beregnings- og slutningstenkning: Grunnlaget for datavitenskap av Ani Adhikari, John DeNero og David Wagner vil hjelpe deg å lære statistikkgrunnlag for datavitenskap. 

Denne boken ble utviklet som en følgesvenn til Data 8: Grunnlaget for datavitenskap kurs tilbys ved UC Berkeley. Temaene som dekkes i denne boken inkluderer:

  • Introduksjon til datavitenskap 
  • Programmering i Python 
  • Datatyper, sekvenser og tabeller
  • Visualisering
  • Funksjoner og tabeller
  • Tilfeldighet 
  • Prøvetaking og empirisk distribusjon 
  • Hypotesetesting 
  • Anslag 
  • Regresjon 
  • Klassifisering

Link: Beregnings- og slutningstenkning: Grunnlaget for datavitenskap

Probabilistisk programmering og Bayesianske metoder for hackere eller Bayesian Methods for Hackers er en populær bok om Bayesianske metoder i statistikk.

"Bayesianske metoder for hackere": En introduksjon til bayesianske metoder + probabilistisk programmering med et beregnings-/forståelse-først, matematikk-andre synspunkt. Alt i ren Python 😉 

 

- kilde

Du vil bli kjent med sannsynlighetsteori og Bayesiansk slutning mens du bruker PyMC-pakken. Innholdet i denne boken er som følger:

  • Introduksjon til Bayesianske metoder
  • PyMC-biblioteket
  • Markov-kjeden Monte Carlo
  • Loven om store tall
  • Tap funksjoner
  • Priors

Link: Probabilistisk programmering og Bayesianske metoder for hackere

Jeg håper du syntes denne oppsummeringen av gratis statistikkbøker var nyttig. Blandingen av teori og praktisk praksis bør hjelpe deg med å øke dine datavitenskapelige ferdigheter og ta mer informerte beslutninger når du arbeider med store virkelige datasett.

Hvis du foretrekker å jobbe gjennom gratis kurs eller ønsker å supplere lesingen med kurs, sjekk ut 5 gratis kurs for å mestre statistikk for datavitenskap.
 
 

Bala Priya C er en utvikler og teknisk skribent fra India. Hun liker å jobbe i skjæringspunktet mellom matematikk, programmering, datavitenskap og innholdsskaping. Hennes interesseområder og ekspertise inkluderer DevOps, datavitenskap og naturlig språkbehandling. Hun liker å lese, skrive, kode og kaffe! For øyeblikket jobber hun med å lære og dele kunnskapen sin med utviklerfellesskapet ved å skrive veiledninger, veiledninger, meningsartikler og mer. Bala lager også engasjerende ressursoversikter og kodingsveiledninger.

spot_img

Siste etterretning

spot_img