Zephyrnet-Logo

Was ist Datenqualität? Dimensionen, Vorteile, Einsatzmöglichkeiten – DATAVERSITY

Datum:

DatenqualitätDatenqualität

Datenqualität (DQ) beschreibt den Grad des Vertrauens von Unternehmen und Verbrauchern in die Nützlichkeit von Daten auf der Grundlage vereinbarter Geschäftsanforderungen. Diese Erwartungen entwickeln sich basierend auf sich ändernden Kontexten auf dem Markt.

Wenn Menschen neue Informationen erhalten und unterschiedliche Interaktionen erleben, müssen sich die Geschäftsanforderungen aktualisieren und die Anforderungen an die Datenqualität innerhalb der Lebensdauer der Daten neu definieren. Da DQ ein bewegliches Ziel darstellt, sind fortlaufende Diskussionen und Konsens erforderlich, um ein vertrauenswürdiges Niveau zu erreichen und auf diesem zu bleiben. 

Während manche Menschen möglicherweise Erwartungen an die Datenqualität haben, die auf früheren Erfahrungen oder impliziten Annahmen basieren, müssen diese Faktoren verbalisiert werden, um bei Bedarf Fehlinterpretationen zu vermeiden. Damit die Datenqualität hilfreich ist, müssen Gespräche einen Konsens darüber erfordern, welches DQ-Niveau machbar oder gut genug ist und wie viel Abweichung vom DQ-Schwellenwert als tolerierbar angesehen wird. 

Sobald Unternehmen diese Maßnahmen verstanden haben, können sie Maßnahmen zur Aufrechterhaltung und Verbesserung des DQ durchführen, wie z effektives Datenqualitätsmanagement, Tool-Nutzung und Audits. Am wichtigsten ist, dass Unternehmen DQ als fortlaufenden Service betrachten müssen, der notwendig ist, um den Anstieg einzudämmen Probleme und Vorfälle.

Datenqualität definierend

Die meisten Datenqualitätsdefinitionen umfassen eine Sammlung von Techniken Entwickelt, um die Bedürfnisse derjenigen zu erfüllen, die diese Daten konsumieren. Diese Methodik umfasst die Datenplanung, -implementierung und -kontrolle zur Datenerstellung passen für einen Zweck bei seiner Verwendung.

Darüber hinaus tauchen in DQ-Beschreibungen gemeinsame Themen auf. Entsprechend Gartner, DQ erfüllt Parameter und umfasst Technologien zum „Identifizieren, Verstehen und Korrigieren von Fehlern in Daten, die eine effektive Informationsverwaltung über betriebliche Geschäftsprozesse und Entscheidungsfindung hinweg unterstützen“. 

Das Wang-Strong-Framework erweitert das Konzept von DQ weiter, um zusätzliche Anforderungen der Datenkonsumenten an die Vertrauenswürdigkeit zu erfüllen. Sie geben DQ-Attribute in intrinsische, kontextbezogene, repräsentative und Zugänglichkeitsmerkmale ein. 

Während Wang-Strong wertvolle Einblicke in die Erwartungen der Datenkonsumenten an DQ liefert, könnten diese auf die Erwartungen von Datenproduzenten, Administratoren und anderen ausgeweitet werden, die ebenfalls an DQ beteiligt sind. Daher können alle möglichen DQ-Beschreibungen und -Dimensionen exponentiell wachsen und den Leser möglicherweise überfordern.

Dimensionen der Datenqualität

Eine Liste von DQ-Dimensionen oder -Attributen sollte erkennbar, objektiv, leicht verständlich und für die meisten DQ-Inhalte Standard sein. Zu diesem Zweck hat DAMA-DMBoK2 und die Einführung von DATAVERSITY auf Dimensionen der Datenqualität haben Angaben zu folgenden Maßen gemacht:

  • Genauigkeit: Die Genauigkeit misst, wie gut die verfügbaren Daten mit Erfahrungen in der realen Welt übereinstimmen. DATAVERSITY ist beispielsweise ein Unternehmen mit Hauptsitz in Kalifornien. Diese Tatsache spiegelt sich in den auf der Website dargestellten Daten wider Website .
  • Vollständigkeit: Die Vollständigkeit umfasst den Umfang, in dem Daten und ihre Metadaten vorhanden sind. Beispielsweise verfügt DATAVERSITY über eine Webseite namens „Kontakt“ mit der Überschrift „Unternehmenszentrale“, die ihre physische Adresse und Telefonnummer enthält.
  • Konsistenz: Konsistenz beschreibt, wie ähnlich die Originaldaten und die Daten sind, die an ein anderes System, einen Speicher, eine Schnittstelle oder über eine Pipeline übermittelt werden. Beispielsweise ist die E-Mail-Adresse von Tony Shaw auf den Webseiten „Kontakt“ und „Pressemitteilungen“ konsistent.
  • Integrität: Integrität misst, wie gut ein Datensatz seine Struktur und Beziehungen beibehält, nachdem Datenprozesse ausgeführt wurden. Sollte es beispielsweise bei DATAVERSITY zu einem vorübergehenden Ausfall kommen, wird die Webseite wie zuvor und ohne Beschädigung wiederhergestellt, sobald das Problem behoben ist.
  • Einzigartigkeit/Deduplizierung: Diese Dimension deckt eine oder mehrere Versionen einer durch die Daten beschriebenen Entität auf. Beispielsweise kommen alle Informationen auf der Seite „Kontakt“ nur einmal vor und wiederholen sich weder auf dieser noch auf einer anderen Seite der DATAVERSITY-Website.
  • Gültigkeit: Die Gültigkeit bestätigt, dass sich die Daten gemäß den Geschäftserwartungen verhalten. Beispielsweise enthält die Seite „Kontakt“ von DATAVERSITY weder Webinar-Informationen noch einen Artikel, sondern nur Informationen zur Kontaktaufnahme.

Datenqualität vs. Datenbereinigung

Obwohl sich die Datenbereinigung mit der Datenqualität überschneidet, bedeuten sie nicht dasselbe. Unter Datenbereinigung versteht man die Automatisierung der Vorbereitung der Daten eines Systems für die Analyse durch die Beseitigung von Ungenauigkeiten oder Fehlern. 

Data Quality verfügt über eine Datenbereinigung und umfasst die Praktiken und Richtlinien, die zur Verwaltung der DQ erforderlich sind, um eine ausreichend gute Datenqualität zu gewährleisten. Diese Richtlinien überschneiden sich mit Datenverwaltung – die verschiedenen Komponenten, die zur formalen Datenkontrolle und zur Steuerung von DQ-Rollen, -Prozessen, -Kommunikationen und -Metriken erforderlich sind. 

Durch Data Governance erfahren Unternehmen, welche Datenbereinigungstools sie kaufen müssen und wie sie mithilfe der Automatisierung eine bessere DQ erzielen können. Data Governance und andere Aspekte der DQ-Planung leiten Unternehmen bei der Datenbereinigung und bei der Bewertung des Fortschritts in Richtung einer ausreichend guten DQ. Da sich der Geschäftskontext und die Erfahrungen ändern, ist dieser Aspekt der Datenqualität noch wichtiger geworden als nur die Datenbereinigung.

Beispielsweise führt ein Unternehmen eine Datenbereinigung auf mehreren Systemen durch. Es kauft ein neues KI-System für bessere und schnellere Erkenntnisse. Bei den Data Governance- und DQ-Aktivitäten wird berücksichtigt, dass die Organisation unter anderem ihren Datenbereinigungsprozess aktualisieren muss, um die DQ für den Transport zum neuen KI-System zu verbessern.

Warum ist Datenqualität wichtig?

Das Erreichen eines akzeptablen Niveaus an Datenqualität bleibt für jedes Unternehmen von entscheidender Bedeutung, um profitabel zu bleiben und erfolgreich zu sein. Dies bedeutet, ein Gleichgewicht zwischen der Überlassung von DQ dem Zufall und der Lähmung im Streben nach absolutem Vertrauen in die Daten zu finden.

Einerseits müssen Unternehmen und Verbraucher den Daten vertrauen, die sie verarbeiten und nutzen. Eine DQ mit weniger Genauigkeit durchzuführen, kostet Geld, Zeit und möglicherweise Leben. Alternativ ist es nicht möglich, alle möglichen Möglichkeiten abzudecken, bei denen DQ versagt. Beispielsweise können Unternehmen nicht die 100-prozentige Gültigkeit jedes Notrufs und jeder SMS an jeden Disponenten in den USA von jedem LAN-Anschluss und jeder Mobiltelefonversion aus gewährleisten. Wenn ein Prüfer jeden Telefontyp auf eine mögliche Fehlwahl der Notrufnummer 911 überprüfen würde, bliebe keine Zeit, auf den Notfall zu reagieren.

Ein guter DQ sorgt für Ausgeglichenheit und Vertrauen zwischen Unternehmen und Verbrauchern kritische Datenelemente (CDEs), wichtige Geschäftsinformationen für erfolgreiche Abläufe und Nutzung. Wenn beispielsweise sichergestellt wird, dass 90 % der in den letzten drei Jahren verwendeten Geräte eine 15 %ige Verbesserung bei der Rücksendung gültiger Notrufe aufweisen, wird ein Gleichgewicht erreicht.

Vorteile qualitativ hochwertiger Daten

Viele Artikel verbinden DQ mit reduziert Risiko und Kosten, verbessert Verwaltungseffizienz und Produktivität sowie einen positiven Ruf. Darüber hinaus senkt DQ die Kosten und erhöht die Chancen für Geschäftswachstum.

Eine gute Datenqualität verspricht zusätzliche Vorteile. Es macht Unternehmen agiler, insbesondere wenn sie mit dynamischen Veränderungen konfrontiert sind, und bietet einen Weg, DQ-Probleme in Einklang zu bringen und DQ-Verbesserungen zu erzielen.

Diese Vorteile werden bei DQ-Ausfällen deutlich, die zwangsläufig auftreten. Unternehmen mit einem guten DQ können die Grundursachen und die zu ergreifenden Maßnahmen leichter identifizieren und beides gut kommunizieren. 

Da durch die Implementierung einer ausreichend guten DQ das Vertrauen der Unternehmen gestärkt wurde, werden Geschäftsleute und Kunden eher dazu neigen, Empfehlungen und Maßnahmen rund um die Behebung zu unterstützen. Folglich hat ein Unternehmen mit guter Datenqualität mehr Impulse für das Wachstum seiner Dienstleistungen oder Produkte.

Bild verwendet unter Lizenz von Shutterstock.com

spot_img

Neueste Intelligenz

spot_img