Logo Zéphyrnet

5 livres gratuits pour maîtriser les statistiques pour la science des données – KDnuggets

Date :

5 livres gratuits pour maîtriser les statistiques pour la science des données
Image par l'éditeur
 

Pour apprendre la science des données, vous avez également besoin de bases solides en mathématiques. Et les statistiques font partie de ces compétences mathématiques essentielles à la science des données. 

Cependant, l'apprentissage des statistiques peut être intimidant, surtout si vous venez d'une spécialisation autre que les mathématiques ou l'informatique. Pour vous aider à démarrer, nous avons compilé une liste de livres gratuits qui rendent accessibles les statistiques pour la science des données.

La plupart de ces livres adoptent une approche pratique des concepts statistiques, ce dont vous avez besoin pour utiliser efficacement les statistiques en tant que data scientist. Passons donc en revue ces livres de statistiques.

La  Statistiques d'introduction Le livre est une introduction accessible aux statistiques qui couvre ce que couvre généralement un cours d'introduction aux statistiques d'un semestre dans les collèges. 

Disponible en accès gratuit sur OpenStax et rédigé par une équipe d'auteurs experts, ce livre adopte une approche des statistiques axée d'abord sur l'application plutôt qu'une approche axée sur la théorie et comprend des exemples d'exercices pour chaque sujet. 

Ce livre vous aidera à apprendre les éléments suivants :

  • Échantillonnage et données 
  • Les statistiques descriptives 
  • Sujets en Probabilités et variables aléatoires 
  • Distribution normale 
  • Le théorème central limite 
  • Intervalles de confiance 
  • Tests d'hypothèses 
  • La distribution du chi carré
  • Régression linéaire et corrélation 
  • Distribution F et ANOVA unidirectionnelle

Lien : Statistiques d'introduction 2e

Introduction aux statistiques modernes est un manuel en ligne gratuit du projet OpenIntro et est écrit par les auteurs Mine Çetinkaya-Rundel et Johanna Hardin.

Si vous souhaitez apprendre les bases des statistiques pour une analyse efficace des données, alors ce livre est fait pour vous. Le contenu de ce livre est le suivant :

  • Introduction aux données 
  • L'analyse exploratoire des données 
  • Modélisation de régression 
  • Fondements de l'inférence 
  • Inférence statistique 
  • Modélisation inférentielle

Lien : Introduction aux statistiques modernes

Pensez aux statistiques par Allen B. Downey vous aidera à apprendre et à mettre en pratique les concepts statistiques à l'aide de Python. 

Vous pouvez ainsi appliquer vos compétences Python pour apprendre les concepts de statistiques et de probabilités afin de travailler efficacement avec les données. Au fur et à mesure que vous parcourez le livre, vous pourrez écrire de courts programmes Python et vous entraîner avec des ensembles de données réels pour renforcer votre compréhension des concepts statistiques.

Les thèmes abordés sont les suivants :

  • L'analyse exploratoire des données 
  • Distribution 
  • Fonctions de masse de probabilité 
  • Fonctions de distribution cumulative 
  • Modélisation des distributions 
  • Fonctions de densité de probabilité 
  • Liens entre les variables 
  • estimation 
  • Tests d'hypothèses 
  • Moindres carrés linéaires 
  • Régression 
  • Analyse de survie 
  • Méthodes analytiques

Lien : Pensez aux statistiques 2e

Pensée informatique et inférentielle : les fondements de la science des données par Ani Adhikari, John DeNero et David Wagner vous aidera à apprendre les bases des statistiques pour la science des données. 

Ce livre a été développé pour accompagner le Données 8 : Fondements de la science des données cours offert à l'UC Berkeley. Les sujets abordés dans ce livre comprennent :

  • Introduction à la science des données 
  • Programmation en Python 
  • Types de données, séquences et tables
  • Visualisation
  • Fonctions et tableaux
  • Le hasard 
  • Échantillonnage et distribution empirique 
  • Tests d'hypothèses 
  • estimation 
  • Régression 
  • Classification

Lien : Pensée informatique et inférentielle : les fondements de la science des données

Programmation probabiliste et méthodes bayésiennes pour les pirates ou Bayesian Methods for Hackers est un livre populaire sur les méthodes bayésiennes en statistiques.

« Méthodes bayésiennes pour les hackers » : Une introduction aux méthodes bayésiennes + programmation probabiliste avec un point de vue calcul/compréhension d'abord, mathématique ensuite. Le tout en Python pur 😉 

 

- Identifier

Vous vous familiariserez avec la théorie des probabilités et l'inférence bayésienne tout en utilisant le Paquet PyMC. Le contenu de ce livre est le suivant :

  • Introduction aux méthodes bayésiennes
  • La bibliothèque PyMC
  • Chaîne de Markov Monte Carlo
  • La loi des grands nombres
  • Fonctions de perte
  • Prieurs

Lien : Programmation probabiliste et méthodes bayésiennes pour les pirates

J'espère que vous avez trouvé cette synthèse de livres de statistiques gratuits utiles. La combinaison de théorie et de pratique pratique devrait vous aider à améliorer vos compétences en science des données et à prendre des décisions plus éclairées lorsque vous travaillez avec de grands ensembles de données du monde réel.

Si vous préférez suivre des cours gratuits ou si vous souhaitez compléter vos lectures avec des cours, consultez 5 cours gratuits pour maîtriser les statistiques pour la science des données.
 
 

Bala Priya C est un développeur et rédacteur technique indien. Elle aime travailler à l'intersection des mathématiques, de la programmation, de la science des données et de la création de contenu. Ses domaines d'intérêt et d'expertise incluent le DevOps, la science des données et le traitement du langage naturel. Elle aime lire, écrire, coder et prendre le café ! Actuellement, elle travaille à l'apprentissage et au partage de ses connaissances avec la communauté des développeurs en créant des didacticiels, des guides pratiques, des articles d'opinion, etc. Bala crée également des aperçus de ressources attrayants et des didacticiels de codage.

spot_img

Dernières informations

spot_img