Zephyrnet-logo

Een raamwerk voor datakwaliteit creëren – DATAVERSITY

Datum:

Gajus / Shutterstock.com

Een organisatie kan haar Data Quality-doelen en -normen definiëren, en de stappen die nodig zijn om deze doelen te bereiken, door een Data Quality-framework te creëren. Het maken ervan omvat een beoordeling van de huidige gegevenskwaliteit van de organisatie. Een Data Quality raamwerk kan worden omschreven als een handleiding voor het verbeteren van de kwaliteit van de data.

Met een Data Quality-framework kan uw bedrijf zijn Data Quality-doelstellingen en -normen definiëren, evenals de acties die nodig zijn om deze doelen te bereiken. 

Veel grote organisaties hebben daar moeite mee hun gegevenskwaliteit verbeteren. Het kan zijn dat ze meerdere gegevensbronnen hebben die 'bijna' exacte dubbele gegevenssets produceren, waardoor consistentieproblemen ontstaan, of er kunnen afwijkingen zijn die de nauwkeurigheid van de gegevens beïnvloeden. Het wegnemen van deze zorgen en het bereiken van een hoge mate van datakwaliteit zal de besluitvorming verbeteren en helpen bij het bereiken van langetermijndoelen.

Een effectief Kader voor datastrategie kunnen de risico's die gegevens van lage kwaliteit ondersteunen minimaliseren en de gegevens die worden gebruikt voor besluitvormingsdoeleinden verbeteren.

Terwijl het bedrijf evolueert

Een startend bedrijf heeft misschien in eerste instantie geen behoefte aan het organiseren van enorme hoeveelheden data (het heeft nog geen enorme hoeveelheden data om te organiseren), maar een master data management (MDM)-programma aan het begin kan opmerkelijk nuttig zijn. Masterdata is de cruciale informatie die nodig is om nauwkeurig en efficiënt zaken te doen. Zo bevatten de masterdata van het bedrijf onder meer de juiste adressen van de nieuwe klanten van de start-up. 

Masterdata moeten accuraat zijn om bruikbaar te zijn; het gebruik van onnauwkeurige masterdata zou zelfdestructief zijn.

Als de organisatie internationaal zaken doet, kan het nodig zijn om te investeren in een Data Governance (DG) programma om met internationale wet- en regelgeving om te gaan. Bovendien is een Data Governance programma beheert de beschikbaarheid, integriteit en veiligheid van de bedrijfsgegevens. Een effectief DG-programma zorgt ervoor dat gegevens consistent en betrouwbaar zijn en niet worden misbruikt.

Een goed ontworpen DG-programma omvat niet alleen nuttige software, maar ook beleid en procedures voor mensen die omgaan met de gegevens van de organisatie.

Een Data Quality-framework wordt normaal gesproken ontwikkeld en gebruikt wanneer een organisatie data op ingewikkelde manieren is gaan gebruiken voor onderzoeksdoeleinden. Het wordt vaak gebruikt wanneer een datameer nodig is voor opslag. 

Naarmate een organisatie groeit, verzamelt zij haar eigen interne gegevens, die, wanneer ze worden geanalyseerd, kunnen worden gebruikt om de interne processen van het bedrijf efficiënter te maken. Wanneer enorme hoeveelheden gegevens uit externe bronnen worden verzameld voor ontwikkelingsdoeleinden business intelligence, wordt het vaak opgeslagen in een data lake.

Een overzicht van raamwerken voor gegevenskwaliteit

Een Data Quality-framework zal helpen de investeringen van het bedrijf in datakwaliteit te maximaliseren Data analytics door ervoor te zorgen dat ze op de juiste manier worden gebruikt en nauwkeurige inzichten bieden. Om succesvol te zijn moet een Data Quality-framework echter worden afgestemd op de behoeften van de organisatie. Om effectief te zijn moet het Data Quality-framework geïntegreerd worden met het beleid van het Data Governance-programma.

Terwijl bedrijven meer gegevens blijven genereren en verzamelen dan mogelijk is daadwerkelijk gebruikt worden, hebben ze een Data Quality-strategie nodig om consistentie te bieden. Het ontbreken van een raamwerk voor gegevenskwaliteit kan tot veel uitdagingen leiden, waaronder:

  • Inconsistent datagebruik binnen het hele bedrijf: Verschillende afdelingen kunnen data op verschillende manieren interpreteren en gebruiken, waardoor verwarring en fouten ontstaan.
  • Slechte gegevenskwaliteit: dit kan kostbare fouten veroorzaken en resulteren in onnodige kosten voor het herwerken van de gegevens.
  • Een gebrek aan transparantie: Gegevens die in silo's zijn opgeslagen of verkeerd zijn opgeslagen, kunnen resulteren in ongeïnformeerde en slechte beslissingen.

Het opstellen van een Data Quality-framework is tijdrovend en kan twee tot drie maanden in beslag nemen.

Het beoordelen van de huidige gegevenskwaliteit van de organisatie

Een beoordeling van de huidige Data Quality van de organisatie is een goede eerste stap in het ontwikkelen van een Data Quality raamwerk. Datakwaliteitsbeoordelingen laten zien waar de data vandaan komen, hoe deze door de organisatie stromen en worden gebruikt, en de kwaliteit van de data. Bovendien identificeert de beoordeling hiaten in de gegevenskwaliteit, welk soort fouten de gegevens bevatten, waarom deze dat kwaliteitsniveau hebben en hoe deze kunnen worden opgelost.

Een meer gedetailleerd beoordelingsproces is te vinden hier. Hieronder vindt u de basisstappen voor het beoordelen van de gegevenskwaliteit van de organisatie:

  • Begin met het opstellen van een lijst met zorgen over de gegevenskwaliteit die het afgelopen jaar zijn ontdekt.
  • Besteed tijd (een week of twee) aan het bekijken van de gegevensstroom. Zoek naar twijfelachtige processen en de oorzaak van het probleem.
  • Deel de ontdekte problemen met andere medewerkers, vraag om feedback en neem hun suggesties mee in de beoordeling.
  • Bekijk de lijst met zorgen over de gegevenskwaliteit en bepaal welke de meeste impact hebben op de omzet. Deze moeten als hoge prioriteiten worden beschouwd.
  • Reorganiseer de lijst met gegevensproblemen, waarbij de prioriteiten als eerste worden vermeld. 
  • Stel parameters vast – welke gegevens worden tijdens de beoordeling onderzocht?
  • Stel vast wie de gegevens gebruikt en bepaal hun gegevensgebruiksgedrag, zowel voor als na het voltooien van de beoordeling. Dit zal bepalen of ze aanvullende wijzigingen moeten aanbrengen.

Het creëren van het datakwaliteitskader

Raamwerken voor datakwaliteit zijn hard op weg een belangrijk onderdeel van de datamanagementpuzzel te worden. Ze ondersteunen het werken met zowel externe data van klanten of leveranciers (marketingprojecten, reclamecampagnes, de klantervaring) als interne data om bedrijfsprocessen te stroomlijnen. 

De ontwikkeling van een Data Quality-framework kan gebaseerd zijn op de onderstaande stappen:

Begrijp de behoeften van de organisatie: Dit omvat het identificeren van de kritische soorten gegevens die worden gebruikt bij het nemen van datagestuurde beslissingen. De gegevens die cruciaal zijn voor het nemen van beslissingen verschijnen in dashboards, rapporten en andere nuttige besluitvormingstools. Het begrijpen van de behoeften van de organisatie omvat ook het vinden en corrigeren van problemen met de gegevensstroom. 

Definieer de doelstellingen voor gegevenskwaliteit van de organisatie: Meestal gaat het hierbij om het werken met 'dimensies' van gegevenskwaliteit (bijvoorbeeld nauwkeurigheid, volledigheid, tijdigheid, consistentie en relevantie), die worden gebruikt om de kwaliteit van de gegevens te bepalen. Elke dimensie moet worden gebruikt bij het meten van de kwaliteit van de gegevens. 

Profileer de gegevens: Gebruik van gegevensprofilering software om problemen met de gegevenskwaliteit te ontdekken en te onderzoeken, bijvoorbeeld gegevensduplicatie, gebrek aan consistentie in de gegevens en een gebrek aan nauwkeurigheid of volledigheid. Dit proces kan worden gebruikt om de aard en omvang van de problemen met de gegevenskwaliteit van het bedrijf te begrijpen.

Maak kennis met de DG- en MDM-programma's: Dit moet gepaard gaan met gesprekken met gegevens stewards of leden van de Data Governance commissie. De discussies moeten algemene klachten, suggesties voor verbeteringen en problemen met de softwarecompatibiliteit omvatten.

Ontwikkel beleid voor het verbeteren en behouden van de gegevenskwaliteit: Het Data Governance-programma zou al een reeks nuttige beleidslijnen moeten hebben, die moeten worden onderzocht en aangepast om het Data Quality-raamwerk te ondersteunen. 

Onderzoek en implementeer geautomatiseerde datakwaliteitsprocessen: Automatisering is noodzakelijk om data van hoge kwaliteit te kunnen leveren. Automatisering is aanzienlijk sneller dan mensen en elimineert menselijke fouten. Implementeren Tools voor gegevenskwaliteit kan de processen voor het controleren en opschonen van gegevens automatiseren.

Observeerbaarheid implementeren: Dashboards zijn een zeer functionele manier geworden om een ​​monitoringsysteem voor de gegevensstroom te bieden. Een Data Quality-dashboard zal in de loop van de tijd een verscheidenheid aan datasets volgen, analyseren en meten. Daarnaast bieden deze dashboards een overzicht van de langetermijnprestaties van de organisatie.

Ontwikkel een filosofie om het Data Quality-framework regelmatig bij te werken: Helaas is datakwaliteit geen eenmalige inspanning. Het vergt voortdurende inspanningen om het raamwerk te herzien en te verbeteren. Vraag continu feedback aan de stewards. Het Data Quality-framework is bedoeld als een levend document dat evolueert en zich aanpast aan veranderende omstandigheden. Het moet regelmatig worden herzien en bijgewerkt om het af te stemmen op de behoeften en doelstellingen van het bedrijf.

Trein personeel: Het is belangrijk om personeel en management te informeren over zowel het belang van datakwaliteit voor de organisatie als over de nieuwe processen en veranderingen die zijn geïmplementeerd. Het creëren van een werkplekcultuur die de waarde van datakwaliteit begrijpt, is noodzakelijk om ervoor te zorgen dat het datakwaliteitsframework goed functioneert.

De toekomst van raamwerken voor datakwaliteit

Kaders voor datakwaliteit worden steeds belangrijker voor organisaties die duidelijk beleid en procedures willen ontwikkelen voor hun gebruik van de cloud, data lake-opslag, analyses en data in het algemeen. Omdat organisaties bij het nemen van beslissingen steeds meer afhankelijk zijn van data, wordt een Data Quality-framework steeds belangrijker voor het leveren van nauwkeurige data van hoge kwaliteit. 

Naarmate het gebruik van de cloud, datameren en nieuwe technologieën toeneemt, zal ook het gebruik van Data Quality-frameworks toenemen.

spot_img

Laatste intelligentie

spot_img