Logo Zéphyrnet

Mesures de la qualité des données : importance et utilisation

Date :

Les métriques de qualité des données sont un système de mesure qui permet d'évaluer la « qualité des données ». Les métriques de qualité des données peuvent être utilisées pour déterminer l'utilité et la pertinence des données, et elles aident à séparer les données de haute qualité des données de faible qualité. Il est beaucoup plus facile et plus sûr de prendre des décisions commerciales basées sur des informations fiables.

Une mauvaise information (basée sur des données de mauvaise qualité) peut avoir un impact négatif sur les décisions commerciales. Des données de mauvaise qualité peuvent nuire aux performances de l'entreprise, réduire l'innovation et réduire la compétitivité.

OBTENEZ UN ACCÈS ILLIMITÉ À PLUS DE 160 COURS EN LIGNE

Choisissez parmi une large gamme de cours de gestion de données à la demande et de programmes de formation complets avec notre abonnement premium.

Les personnes qui développent l'informatique décisionnelle et effectuent des analyses de données doivent apprendre comment Qualité des données est mesuré et quelles dimensions utiliser. Bien que la qualité des données ne soit pas parfaite, il est important de la rendre aussi propre que possible, en particulier si elle doit être utilisée pour l'informatique décisionnelle. Lorsque les bons indicateurs sont appliqués, les entreprises savent où elles en sont et les objectifs à atteindre.

Qu'est-ce qui peut affecter négativement la qualité des données ?

De nombreux facteurs peuvent affecter la qualité des données, et il est important de les déterminer pour éliminer ceux qui sont préjudiciables. (Il peut également y avoir des facteurs positifs auxquels il convient de prêter attention.) Voici les facteurs préjudiciables les plus courants :

  • Saisie manuelle: Erreurs commises lors de la saisie manuelle des données
  • Décroissance des données : Les données peuvent commencer par être exactes, mais au fil du temps, les choses changent et les données ne sont jamais mises à jour
  • Mouvement de données : Cette erreur apparaît lors du déplacement de données d'un système à un autre, notamment lorsqu'elles sont transformées d'un format à un autre

Métriques vs KPI

Métriques et KPI (indicateurs clés de performance) sont souvent confondus. Les indicateurs de performance clés sont un moyen de mesurer les performances sur une période de temps, tout en travaillant vers un objectif spécifique. Les KPI fournissent des objectifs cibles pour les équipes et des jalons pour mesurer les progrès. Les métriques, quant à elles, utilisent des dimensions pour mesurer la qualité des données.

Il est malheureusement facile d'utiliser les termes de manière interchangeable, mais ce n'est pas la même chose. Les indicateurs de performance clés peuvent aider à développer la stratégie et l'orientation d'une organisation. Les métriques sont plus un système de mesure « business as usual ». Un KPI est un type de métrique.

Importance et avantages des mesures de la qualité des données

Les entreprises peinent à s'adapter au flot de nouvelles technologies et techniques de traitement des données. La capacité non seulement de s'adapter aux circonstances changeantes, mais aussi d'adopter de manière éclectique le meilleur de ces technologies et techniques, peut conduire à des améliorations à long terme, aider à minimiser le stress au travail et augmenter les profits. L'utilisation de données de haute qualité pour la prise de décision peut faire la différence entre le succès et l'échec.

Les principaux objectifs d'une entreprise sont de devenir plus rentables et prospères, et des données de haute qualité (informations précises) peuvent aider à atteindre ces objectifs.

Des données de haute qualité peuvent profiter aux entreprises de toutes les industries et de tous les secteurs. Certains des avantages tirés de la compréhension et du maintien de données de haute qualité sont :

  • Commercialisation améliorée : L'exactitude des données joue un rôle essentiel dans le marketing, allant de l'expérience client à la recherche marketing. Le volume de données marketing actuellement disponibles peut aider à atteindre certains objectifs commerciaux.
  • Prise de décision améliorée : Les mesures de la qualité des données peuvent fournir des données précises à des fins de prise de décision. À son tour, la productivité augmente, tout comme la confiance dans l'informatique décisionnelle et l'analyse des données.
  • Amélioration de la satisfaction client : Le service client est actuellement un processus très orienté données. Les clients d'aujourd'hui ont appris à s'attendre à des expériences efficaces et personnalisées, et se fâchent si ces attentes ne sont pas respectées. (Ces attentes brisées embêtantes.)
  • Réductions de coûts : Cet avantage repose sur de nombreuses dimensions. La fiabilité des données permet aux entreprises de terminer plus de projets en moins de temps.

L'intendant des données

Un intendant des données assure la surveillance des données au sein d'une organisation et est également chargé d'assurer la qualité des actifs de données d'une organisation. Cela comprend la compréhension et la mesure de la qualité ou de l'exactitude des données. En utilisant les bons outils de qualité des données, un gestionnaire des données peut développer un système qui prend en charge des données de haute qualité.

Dave Wells, instructeur et analyste en gestion de données chez Eckerson déclaré:

"Aujourd'hui, les gestionnaires de données sont au centre de la collaboration, de la coordination et de la communication entre les consommateurs de données, les gouverneurs de données et le personnel de gestion des données."

Bien que un grand nombre des dimensions de la qualité des données ont été créées et définies, il existe quelques dimensions clés que les gestionnaires de données peuvent utiliser avec une relative facilité pour garantir la qualité des données.

Dimensions clés de la qualité des données

Dimensions de la qualité des données fournissent un moyen de catégoriser différents types de mesures pour la qualité des données. Ce système de mesures fournit une structure sous-jacente qui soutient la confiance dans les données utilisées.

D'une manière générale, différentes dimensions appliquent différents systèmes de mesure. Par exemple, l'exactitude compare les données (une représentation symbolique du monde réel, ou au moins des parties de celui-ci) avec le monde réel réel, tandis que la mesure de l'exhaustivité nécessite de déterminer la quantité d'informations manquantes dans les formulaires. Vous trouverez ci-dessous les dimensions de base nécessaires pour effectuer des évaluations fiables :

  • Exactitude: Précision des données est critique dans les grandes organisations, où les pénalités en cas d'échec sont élevées. Dans le secteur financier, l'exactitude des données est généralement noire ou blanche - elle est exacte ou non. Mesurer la précision consiste à trouver le « pourcentage de valeurs » qui sont correctes, par rapport à la réalité. Cela peut être fait en prélevant des échantillons et en utilisant des statistiques.
  • Complétude: Ce dimension est utilisé pour confirmer toutes les informations nécessaires incluses dans les formulaires et les demandes.
  • Cohérence: Le maintien d'une relation synchrone avec d'autres bases de données est essentiel pour garantir la cohérence des données et leur mise à jour régulière. (Certains systèmes logiciels peuvent aider à cela.)
  • Intégrité: Mesure intégrité des données implique l'utilisation de toutes les mesures de qualité des données énumérées ci-dessus. (Il est préférable de commencer par prendre ces mesures, de les enregistrer, puis de les utiliser pour mesurer l'intégrité.) Un exemple de métrique d'intégrité est le pourcentage de données qui sont « identiques » sur plusieurs systèmes.
  • Reproduction: La duplication peut être une source d'incohérence. Lorsque le document original est mis à jour, la copie peut ne pas l'être. Le problème survient lorsque quelqu'un utilise la copie au lieu de l'original mis à jour.
  • Opportunité: Ce dimension montre l'exactitude des données à des moments précis dans le temps. Par exemple, un client déménage et prévient sa banque, mais la banque ne traite pas le changement d'adresse pendant trois jours. Ces types de retards dans les délais peuvent entraîner des erreurs. Une mesure de l'actualité est le pourcentage de données précises qui peuvent être obtenues dans un certain laps de temps (mois, semaines ou jours).

Gouvernance des données et qualité des données

Lorsqu'une organisation décide de se concentrer sur la question de la qualité des données, les analystes peuvent utiliser des métriques de qualité des données pour identifier les erreurs de données, dans l'ensemble. Gouvernance des données, cependant, peut être difficile à mesurer, principalement parce qu'il utilise non seulement des mesures de qualité des données, mais peut également inclure de nouveaux processus, de nouvelles attentes et de nouvelles responsabilités. Il est important de considérer différentes métriques qui peuvent refléter les complexités de la gouvernance des données.

Bien que Gouvernance des données et la qualité des données sont des disciplines différentes, elles fonctionnent en parallèle.

Lorsque l'accent mis sur la qualité des données est appliqué à un programme de gouvernance des données, la qualité des données fournit une vision beaucoup plus complexe de la qualité. Il offre une vision de la qualité qui exprime la manière dont l'organisation utilise les données et permet aux gestionnaires de données d'identifier les problèmes à résoudre.

Les mesures de la valeur commerciale fournissent des exemples de valeur commerciale, notamment l'augmentation des bénéfices, la réduction des coûts et l'augmentation de la productivité.

Les mesures de responsabilité et de conformité mesurent l'adoption des normes commerciales et la performance du programme de gouvernance des données. Les éléments suivants peuvent être utilisés pour évaluer la responsabilité et la conformité. Le nombre de:

  • Ministères utilisant des normes de données
  • Systèmes d'information partageant des normes de données
  • Processus métier utilisant des normes de données
  • Rapports de production utilisant des normes de données
  • Personnes de l'organisation utilisant des normes de données

Mesures simples de la qualité des données

Certains systèmes de mesure de la qualité des données se concentrent sur les processus présentant des taux d'erreur. Les erreurs sont mesurées puis utilisées comme indicateurs de la qualité des données. Voici les paramètres que les entreprises peuvent utiliser pour mesurer la qualité de leurs données :

  • Ratio des erreurs aux données : Cette métrique montre le nombre d'erreurs par rapport à la taille de l'ensemble de données. Certaines erreurs courantes incluent des entrées incomplètes, en double ou manquantes.
  • Le nombre de valeurs vides : cela mesure le nombre de champs vides dans un ensemble de données ou de données situées dans le mauvais champ.
  • Erreurs de transformation de données : La transformation de données convertit les données d'un format à un autre. Le nombre d'erreurs est comparé au nombre de transformations.
  • Taux de rebond des e-mails : Les e-mails renvoyés suggèrent que vos données sont de mauvaise qualité. Souvent, les e-mails sont envoyés à la mauvaise adresse et rebondissent en raison d'informations obsolètes ou manquantes.
  • Données sombres : Les données sombres sont des données inutiles qui ont été acquises via différentes opérations de réseau informatique. Il ne peut pas être utilisé pour prendre des décisions ou obtenir des informations.
  • Coûts de stockage des données : Alors que le coût de stockage des données augmente pour une organisation et que la quantité de données utilisées reste la même, il existe des problèmes de qualité des données. La majeure partie des données croissantes est stockée, mais n'est pas utilisée.

Tableaux de bord pour la qualité des données

Les tableaux de bord de qualité des données sont des outils de gestion des informations qui peuvent suivre, analyser et afficher visuellement les métriques utilisées pour mesurer la qualité des données. Les tableaux de bord de qualité des données peuvent être personnalisés en fonction des besoins spécifiques d'une entreprise. Ils peuvent être utilisés pour fournir un instantané de la qualité des données et peuvent également utiliser des données historiques pour identifier les tendances et les modèles.

Des logiciels spécifiques sont disponibles, ainsi que des tableaux de bord adaptables. En outre, un tableau de bord de la qualité des données peut être créé.

Image utilisée sous licence de Shutterstock.com

spot_img

Dernières informations

spot_img