Logo Zéphyrnet

Analyse des attaques de requins australiens

Date :

Cet article a été publié dans le cadre du Blogathon sur la science des données.

Introduction

Récemment, j'ai cherché un ensemble de données intéressant pour apprendre quelque chose de nouveau. Après une longue recherche, j'ai obtenu un ensemble de données sur les attaques de requins en Australie. Cet ensemble de données contient environ 1,100 1791 + morsures de requins et tentatives de morsures de requins entre 2022 et début XNUMX, recueillies par le Société conservatrice de Taronga.

Dans cet article, nous allons apprendre -

  • Comment utiliser les limes à plumes dans les pandas et pourquoi nous les utilisons.
  • Comment tracer barplot et pieplot en utilisant matplotlib et seaborn.
  • Différents faits sur les requins, en prime.

Alors, attachez vos ceintures et commençons.

Les données

Ce jeu de données contient 60 colonnes. Ce sera écrasant si je donne des détails sur chaque colonne. Et aussi, nous n'avons pas besoin de toutes les colonnes ici. Ici, je donne les détails sur 12 colonnes. Si vous voulez en savoir plus sur toutes les colonnes, visitez this lien.

J'ai également effectué un prétraitement avant d'utiliser ces données. Vous pouvez télécharger à la fois les données réelles et prétraitées à partir de mon dépôtdu dossier de données.

Dictionnaire de données

Analyse des données

Avant d'analyser les données, importons le nec

Voir le code sur Essentiel.

Importons maintenant les données à l'aide de pandas.

À partir du code ci-dessus, vous remarquerez que le fichier est au format plume. Le format plume est utile pour

La machine ne lit que les fichiers au format Feather. Parfois, nous devons charger une grande quantité de données plus rapidement. Ici, le format csv n'est pas utile car le temps de chargement des données au format csv augmente lorsque la taille du fichier est importante. La conversion d'un fichier csv en un fichier plume nous aide à réduire la taille du fichier et le temps de chargement du fichier de données est considérablement réduit.

Une chose que vous devez vous rappeler, si vous avez beaucoup de données (comme 5 à 6 Go), essayez Parquet Apache.

Si nous exécutons le code ci-dessus, vous verrez la sortie ci-dessous.

Ces données contiennent 1196 lignes et 12 colonnes. Une fois les données chargées avec succès, voyons maintenant le résumé statistique des données. Tout d'abord, nous voyons le résumé statistique des colonnes numériques.

shark_data.describe()

La sortie ressemblera à celle ci-dessous.

D'après le résultat ci-dessus, nous pouvons facilement voir que -

  • L'âge moyen de la victime est de 28 ans et l'âge maximum d'une victime est de 84 ans. Je pense que le maximum d'attaques de requins est arrivé aux pêcheurs les plus âgés. Nous vérifierons ce fait plus tard.

  • L'âge minimum d'une victime est 0, une valeur nulle ou une erreur.

Pour le année_incident colonne, le résumé statistique n'a pas de sens. Nous devons voir le résumé statistique de cette colonne en convertissant la colonne en catégorie.

shark_data_copy = shark_data.copy() shark_data_copy['incident_year'] = shark_data_copy['incident_year'].astype('object') shark_data_copy.describe(include='O')

D'après le résultat ci-dessus, nous pouvons observer que -

Les attaques de requins augmentent-elles au fil des ans en Australie ?

Ici, nous allons voir si les attaques de requins augmentent au fil des ans ou non. Nous n'avons pas besoin de toutes les années de la table pour le savoir. J'ai donc sélectionné le nombre de données de 1998 à 2022 et tracé un graphique.

Voir le code sur Essentiel.

Après avoir exécuté le code ci-dessus, l'intrigue ressemblera à celle ci-dessous.

D'après le résultat ci-dessus, nous pouvons voir une tendance à la hausse qui indique que les attaques de requins augmentent. Ci-dessous, une capture d'écran d'un journal australien où ce fait est indiqué.

Attaques de requins blancs

Auparavant, nous avons vu à partir de l'inférence statistique que les requins blancs attaquent la plupart des victimes. Voyons où se sont produits le plus d'attaques.

plt.figure(figsize=(10, 6)) sns.countplot(x='state', data=white_shark_case, palette='RdYlBu') plt.xticks(rotation=45) plt.show()

D'après le graphique à barres ci-dessus, nous pouvons voir que la plupart des attaques se produisent en Nouvelle-Galles du Sud. Ce type de requin se trouve principalement dans New South Wales, Australie.

Nous voyons maintenant l'activité de la victime lorsque l'attaque de requin s'est produite.

Voir le code sur Essentiel.

D'après le diagramme circulaire ci-dessus, il est visible que la plupart des victimes apprécient embarquement lorsque l'attaque de requin se produit. Cela signifie que ce requin vient fréquemment à la surface de l'eau.

Qui a le plus de cas d'attaque de requin après White Shark ?

Voyons maintenant qui occupe la deuxième et la troisième place en fonction des cas d'attaques de requins.

Voir le code sur Essentiel.

D'après le graphique à barres ci-dessus, requin tigre et wobbegong ont respectivement la deuxième et la troisième place. Nous allons maintenant voir quelle est l'activité des victimes lorsque ces deux requins les ont attaqués.

Voir le code sur Essentiel.

D'après les graphiques ci-dessus, nous remarquons que les attaques de requins tigres se produisent principalement lorsque la victime est natation or plongée en apnée. Si vous ne savez pas ce qu'est le snorkeling, voici la définition de Wikipedia.

L'attaque de requin Wobbegong se produit lorsque la victime est nager, embarquer ou plonger. Ces requins sont intéressants. Si vous voyez ce type de requin en un coup d'œil, cela ressemble à un tapis. Ci-dessous, une photo de wobbegong.

Si vous voulez en savoir plus sur wobbegong, vous pouvez voir this Vidéo.

Voyons le ratio provoqué/non provoqué pour le requin blanc, le requin tigre et le requin wobbegong, respectivement.

Voir le code sur Essentiel.

Le requin blanc a plus d'attaques non provoquées que les autres. Le requin Wobbegong a un ratio presque égal d'attaques provoquées et non provoquées.

Voyons maintenant combien de personnes sont blessées, indemnes ou subissent des dégâts mortels lors de leurs attaques. Pour cela, utilisez simplement l'extrait de code précédent en remplaçant provoqué/non provoqué à victime_blessure.

Étonnamment, bien que le requin wobbegong ait blessé tant de personnes, ils ne sont pas en premier lieu basés sur des attaques de requins. Cela peut arriver en raison du taux le plus élevé de blessures mortelles subies par les requins blancs.

C

Donc, c'est tout ce que j'ai. Je sais que cet article est assez long, mais je pense qu'il vaut la peine d'être lu. Dans cet article, vous avez appris à –

  • Lisez le fichier plume en utilisant des pandas et quand l'utiliser.
  • Modifiez les données selon vos besoins.
  • Personnalisez différents graphiques.

Mais l'analyse ne s'arrête pas là. Si vous avez quelque chose, faites le moi savoir dans les commentaires. S'il y a quelque chose qui ne va pas de mon côté, je suis toujours là pour vous écouter. Vous pouvez également en faire plus dans les parcelles - il y a tellement d'options de personnalisation. J'ai fait quelques personnalisations de base pour que les débutants ne trouvent pas ces intrigues écrasantes.

Vous pouvez lire mon article sur l'analyse des chocolats noirs. Ici est le lien. Vous pouvez également consulter mon moyenne profil.

Les médias présentés dans cet article n'appartiennent pas à Analytics Vidhya et sont utilisés à la discrétion de l'auteur. 

spot_img

Dernières informations

spot_img

Discutez avec nous

Salut! Comment puis-je t'aider?