Image de Freepik
L'étude de la façon de représenter visuellement les données est connue sous le nom de visualisation des données. Il communique efficacement les résultats des données en traçant graphiquement les données.
Nous pouvons obtenir un résumé visuel de nos données via la visualisation des données. L'esprit humain traite et comprend plus facilement toute donnée donnée lorsqu'elle est présentée avec des images, des cartes et des graphiques.
Les ensembles de données petits et grands bénéficient de la visualisation des données, mais les ensembles de données volumineux sont là où elle brille car il est difficile de visualiser manuellement, sans parler de traiter et de comprendre, toutes nos données.
L'étude de la visualisation des données consiste à tenter de comprendre les données en les plaçant dans un contexte visuel pour révéler des modèles, des tendances et des connexions qui pourraient autrement ne pas être visibles.
La visualisation des données peut être effectuée à l'aide de n'importe quel langage de programmation, mais choisir python est préférable pour visualiser facilement les données car python a de petites lignes de code.
Python a des syntaxes simples et prend très moins de temps pour coder les choses, python fournit également différents packages ou bibliothèques pour la visualisation de données en utilisant les fonctionnalités existantes. Certaines bibliothèques python utilisées pour la visualisation des données sont matplotlib et seaborn et de nombreux autres packages utilisés pour la visualisation des données.
Matplotlib, Seaborn, Bokeh et Plotly sont les bibliothèques en python utilisées pour la visualisation des données.
- matplotlib est utilisé pour tracer les graphiques tels que les nuages de points, les tracés linéaires, les graphiques à secteurs et les graphiques à barres et ce matplotlib fonctionne avec les tableaux et les champs de l'ensemble de données.
- marin est utilisé pour la visualisation complexe de données telles que la coloration et la conception de graphiques et Seaborn fonctionne avec l'ensemble de données.
- Bokeh est utilisé pour la visualisation des données en rendant les choses interactives et utilise HTML et javascript pour représenter les données dans les navigateurs Web.
- Plotly est également utilisé pour la visualisation des données, ce qui rend les graphiques attrayants et permet la personnalisation.
Maintenant, voyons chacun d'eux en détail.
Matplotlib est utilisé pour tracer les graphiques tels que les nuages de points, les tracés linéaires, les graphiques à secteurs et les graphiques à barres et ce matplotlib fonctionne avec les tableaux et les champs de l'ensemble de données.
Matplotlib est une interface de bas niveau, très facile à utiliser et offrant de la flexibilité, comme indiqué, matplotlib fonctionne avec des tableaux créés à l'aide de NumPy.
Pour installer matplotlib, nous devons utiliser la commande,
pip install matplotlib
Exécutez cette commande dans l'invite de commande et vous la verrez comme ceci.
Image par auteur
Maintenant, nous pouvons utiliser matplotlib pour visualiser les données.
Graphique linéaire
Les graphiques linéaires sont utilisés pour représenter les 2 champs différents de l'ensemble de données ou pour montrer la relation entre 2 champs à l'aide de la fonction plot().
Nous pouvons coder en python comme
import pandas as pd
import matplotlib. pyplot as plt data = pd.read_csv("diabetes.csv") plt. plot(data['Preg'])
plt. plot(data['age'])
plt. title("Line Plot")
plt. xlabel('Preg')
plt. label('age')
plt. show()
Sortie :
Nuage de points
Nuage de points sont utilisés pour représenter la relation entre 2 champs en utilisant la fonction scatter() de la bibliothèque matplotlib qui utilise des points pour représenter les données.
Nous pouvons coder en python comme,
import pandas as pd
import matplotlib. pyplot as plt data = pd.read_csv("diabetes.csv") plt. scatter(data['Preg'], data['age'])
plt. title("Scatter Plot")
plt. xlabel('Preg')
plt. label('age')
plt. show()
Sortie :
Diagramme à barres
Les graphiques à barres sont utilisés pour représenter les données catégorielles à l'aide de la fonction bar() de la bibliothèque matplotlib pour représenter les données.
Nous pouvons coder en python comme
import pandas as pd
import matplotlib. pyplot as plt data = pd.read_csv("diabetes.csv") plt. bar(data['Preg'], data['age'])
plt. title("Bar Plot")
plt. xlabel('Preg')
plt. ylabel('age')
plt.show()
Sortie :
Histogramme
Les histogrammes permettent de représenter les données sous forme de groupes à l'aide de la fonction hist() de la matplotlib bibliothèque de représentation des données.
Nous pouvons coder en python comme
import pandas as pd
import matplotlib.pyplot as plt data = pd.read_csv("diabetes.csv") plt.hist(data['age'])
plt.title("Histogram Plot")
plt.show()
Sortie :
Seaborn est utilisé pour la visualisation complexe de données telles que la coloration, la conception de graphiques et Seaborn fonctionne avec l'ensemble de données.
Seaborn a une interface de haut niveau qui donne des sorties attrayantes et colorées.
Pour installer seaborn, nous devons utiliser la commande,
pip install seaborn
Exécutez cette commande dans la commande et l'invite, et vous la verrez comme ceci.
Image par auteur
Maintenant, nous pouvons utiliser le seaborn pour visualiser les données.
Graphique linéaire
Les tracés linéaires sont utilisés pour représenter les 2 champs différents de l'ensemble de données ou pour montrer la relation entre les 2 fonctions lineplot() de champ dans seaborn.
Nous pouvons coder en python comme
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd data = pd.read_csv("diabetes.csv") sns.lineplot(x='Preg', y='age', data=data)
plt.show()
Sortie :
Nuage de points
Les diagrammes de dispersion sont utilisés pour représenter la relation entre 2 champs à l'aide de la fonction scatterplot() de la bibliothèque seaborn qui utilise des points pour représenter les données.
Nous pouvons coder en python comme
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd data = pd.read_csv("diabetes.csv") sns.scatterplot(x='Preg', y='age', data=data, hue='class')
plt.show()
Sortie :
Diagramme à barres
Les graphiques à barres sont utilisés pour représenter les données catégorielles à l'aide de la fonction barplot() de la bibliothèque Seaborn pour représenter les données.
Nous pouvons coder en python comme
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd data = pd.read_csv("diabetes.csv") sns.barplot(x='Preg', y='age', data=data, hue='class')
plt.show()
Sortie :
Histogramme
Les histogrammes sont utilisés pour représenter les données sous forme de groupes en utilisant la fonction histplot() de la bibliothèque matplotlib pour représenter les données.
Nous pouvons coder en python comme
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd data = pd.read_csv("diabetes.csv") sns.histplot(x='age',kde=True, data=data, hue='class')
plt.show()
Sortie :
Bokeh est utilisé pour la visualisation des données en rendant les choses interactives et utilise HTML et javascript pour représenter les données dans les navigateurs Web et a une interactivité de haut niveau.
Pour installer seaborn, nous devons utiliser la commande
pip install bokeh
Exécutez cette commande dans l'invite de commande, vous la verrez comme ceci.
Image par auteur
Maintenant, nous pouvons utiliser le bokeh pour visualiser les données.
Graphique linéaire
Les tracés linéaires sont utilisés pour représenter les 2 champs différents de l'ensemble de données ou pour montrer la relation entre 2 champs à l'aide de la fonction line() en bokeh.
Nous pouvons coder en python comme,
from bokeh.plotting import figure, output_file, show
import pandas as pd graph = figure(title = "Bokeh Bar Chart")
data = pd.read_csv("diabetes.csv") df = data['age'].value_counts() graph.line(df, data['age'])
show(graph)
Sortie :
Nuage de points
Les nuages de points sont utilisés pour représenter la relation entre 2 champs à l'aide de la fonction scatter() de la bibliothèque bokeh qui utilise des points pour représenter les données.
Nous pouvons coder en python comme
from bokeh.plotting import figure, output_file, show
import pandas as pd graph = figure(title = "Bokeh Bar Chart")
data = pd.read_csv("diabetes.csv") df = data['age'].value_counts()
graph.scatter(df, data['age'])
show(graph)
Sortie :
Diagramme à barres
Les graphiques à barres sont utilisés pour représenter les données catégorielles à l'aide des fonctions vbar() et hbar() de la bibliothèque bokeh pour représenter les données.
Nous pouvons coder en python comme
from bokeh.plotting import figure, output_file, show
import pandas as pd graph = figure(title = "Bokeh Bar Chart")
data = pd.read_csv("diabetes.csv") graph.vbar(data['age'], top=data['Preg'])
show(graph)
Sortie :
Plotly est également utilisé pour la visualisation des données, ce qui rend les graphiques attrayants et permet la personnalisation.
Pour installer plotly, nous devons utiliser la commande
pip install plotly
Exécutez cette commande dans l'invite de commande, vous la verrez comme ceci.
Image par auteur
Maintenant, nous pouvons utiliser l'intrigue pour visualiser les données.
Graphique linéaire
Les tracés linéaires sont utilisés pour représenter les 2 champs différents de l'ensemble de données ou pour montrer la relation entre 2 champs à l'aide de la fonction.line() dans plotly.
Nous pouvons coder en python comme
import plotly.express as px
import pandas as pd data = pd.read_csv("diabetes.csv") fig = px.line(data, y='age', color='class')
fig.show()
Sortie :
Nuage de points
Les nuages de points sont utilisés pour représenter la relation entre 2 champs à l'aide de la fonction scatter() de la bibliothèque plotly qui utilise des points pour représenter les données.
Nous pouvons coder en python comme
import plotly.express as px
import pandas as pd data = pd.read_csv("diabetes.csv") fig = px.scatter(data, x='Preg', y='age', color='class')
fig.show()
Sortie :
Diagramme à barres
Les graphiques à barres sont utilisés pour représenter les données catégorielles à l'aide de la fonction bar() de la bibliothèque plotly pour représenter les données.
Nous pouvons coder en python comme
import plotly.express as px
import pandas as pd data = pd.read_csv("diabetes.csv") fig = px.bar(data, x='Preg', y='age', color='class')
fig.show()
Sortie :
Histogramme
Les histogrammes sont utilisés pour représenter les données sous forme de groupes en utilisant la fonction histogram() de la bibliothèque matplotlib pour représenter les données.
Nous pouvons coder en python comme
import plotly.express as px
import pandas as pd data = pd.read_csv("diabetes.csv") fig = px.histogram(data, x='age', color='class')
fig.show()
Sortie :
Ce sont les différentes façons de visualiser des données à l'aide de bibliothèques Python. Résumons maintenant brièvement les choses discutées.
- Tout d'abord, nous avions vu ce qu'est la visualisation de données et pourquoi effectuer une visualisation de données.
- L'étude de la visualisation des données consiste à tenter de comprendre les données en les plaçant dans un contexte visuel pour révéler des modèles, des tendances et des connexions qui pourraient autrement ne pas être visibles.
- Ensuite, nous avons vu comment la visualisation des données peut être effectuée à l'aide de python et pourquoi python peut être choisi pour la visualisation des données.
- Nous avions vu les différentes bibliothèques de visualisation de données en python.
- Nous avons compris chacune des techniques de visualisation de données avec un exemple approprié et un exemple de code écrit avec la sortie.
J'espère que vous avez acquis des connaissances pour visualiser facilement les données en utilisant python et ses différents types de bibliothèques. Vous pouvez en savoir plus sur Python et ses différentes bibliothèques à partir de ressources gratuites telles que Kdnuggets, Écailleurou Wiki.
Vaishnavi Amira Yada est un rédacteur de contenu technique. Elle a des connaissances en Python, Java, DSA, C, etc. Elle s'est retrouvée dans l'écriture et elle a adoré ça.
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
- La source: https://www.kdnuggets.com/2022/12/python-used-data-visualization.html?utm_source=rss&utm_medium=rss&utm_campaign=how-can-python-be-used-for-data-visualization