Zephyrnet-logo

Een metadatastrategie maken en implementeren

Datum:

Het ontwikkelen van een metadatastrategie is noodzakelijk voor een groeiend bedrijf om de efficiëntie te behouden en te verbeteren. Metadata is een kleine hoeveelheid gegevens die wordt gebruikt om een ​​grotere verzameling gegevens (afbeeldingen, tekst, bestanden, digitale objecten) te identificeren. Het wordt gegenereerd telkens wanneer gegevens uit de bron worden verzameld, door een gegevenssysteem worden verplaatst, door gebruikers worden geopend, met andere gegevens worden geïntegreerd, worden opgeschoond of geanalyseerd. 

Elke vorm of hoeveelheid gegevens kan worden getagd met metadata, automatisch (of handmatig). Metadata-tags zijn meestal ontworpen om het gemakkelijk te maken om de gewenste gegevens te vinden. 

WILT U DE DATAKWALITEIT VAN UW ORGANISATIE VERBETEREN?

Leer hoe u aan de slag kunt gaan en gebruik een groot aantal principes en praktijken voor gegevenskwaliteit met onze online cursussen.

De informatie (descriptoren of trefwoorden) die door de metadatatags worden overgebracht, wordt meestal geassocieerd met relevante elementen, zoals de titel, datums, de makers of technische informatie. De tags worden niet aan de gebruiker gepresenteerd, maar zijn in plaats daarvan verborgen in de broncode. Ze geven de inhoud van de metadata door aan browsers, zoekmachines en andere tools. Metadata kan ook aangeven hoe de data is gebruikt. Er zijn zes basistypen van metagegevens:

  • Beschrijvende metagegevens: Dit type metadata wordt gebruikt voor ontdekking en identificatie. Het bevat beschrijvingen zoals de titel, auteur en trefwoorden.
  • Structurele metadata: Bevat beschrijvingen over containers met gegevens. Het beschrijft de versie, relaties en andere kenmerken van digitaal materiaal.
  • Administratieve metagegevens: Geeft informatie over het beheren van een resource, zoals het resourcetype, de machtigingen en hoe en wanneer de gegevens zijn gemaakt.
  • Referentie metadata: Deze vorm van metadata gaat over de inhoud en kwaliteit van statistische gegevens.
  • Statistische metagegevens: Kan worden gebruikt om de processen te beschrijven die betrokken zijn bij het verzamelen, verwerken of produceren van statistische gegevens.
  • Juridische metagegevens: Het geeft informatie over de maker, de auteursrechthebbende en openbare licenties.

Het doel van metadata is om een ​​manier te bieden voor het indexeren, bewaren, openen en ontdekken van digitale bronnen.

Sommige organisaties hebben nooit echt hun data-architectuur, en naarmate ze zijn gegroeid, zijn hun gegevens verspreid en ongeorganiseerd geraakt. Dit kan het lastig maken om de gewenste gegevens te vinden. Om succesvol te zijn in deze moderne wereld, moeten bedrijven hun gegevens snel en efficiënt kunnen vinden en gebruiken.

Gegevensbeheer en metagegevens

Metadata is ontworpen om te werken met Data Governance-software, en het is een kritieke functie van Data Governance, waardoor datasets kunnen worden geïndexeerd en geopend. Een metadatastrategie moet het integreren van de metadata met de Data Governance programma. Dit zal gevoelige of vertrouwelijke gegevens beschermen voordat bestaande privacyregels of wetten worden overtreden (zoals de AVG, CCPA of LGPD). Data Governance biedt verantwoordelijkheid voor data-assets en zorgt ervoor dat de metadata altijd nauwkeurig en consistent is. Traditioneel wordt metadatabeheer gebruikt voor het organiseren en classificeren van gegevens om nalevingsredenen. 

Momenteel automatiseren machine learning-instructies die zijn ingebed in Data Governance-programma's het proces van het vastleggen en beheren van metadata.

Framework voor gegevensbeheer omvat vaak het gebruik van meerdere apps en softwareprogramma's, zoals datawarehousing, datakwaliteit, masterdatabeheer en metadatabeheer. Programma's voor gegevensbeheer kunnen worden gebruikt om volledige transparantie over de gegevensstroom van het bedrijf te ondersteunen, zodat gegevensactiva kunnen worden gedefinieerd, gevolgd, gemeten en beheerd.

Ontwikkeling en implementatie

Een grondig begrip van de metadata van de organisatie is van cruciaal belang voor het effectief implementeren van een metadatastrategie. Bij het ontwikkelen van een metadatasysteem komen een aantal stappen kijken. Het is vooral belangrijk om de tijd te plannen die nodig is om het systeem (herhaaldelijk) te organiseren, implementeren en testen totdat aan alle vereisten is voldaan. Het implementatieplan moet de planning en alle details van het project bevatten.

Het implementatieplan moet het proces opsplitsen in afzonderlijke, beheersbare taken. Het ontwikkelen van een kaart van alle actieve gegevensactiva omvat bijvoorbeeld alle datameren, datawarehouses, databases, cloudopslag, e-mails en andere opslag die door het bedrijf wordt gebruikt. Elke opslaglocatie moet afzonderlijk worden vermeld en gepland voor onderzoek. (De metadata volgen in a data lake, met zijn niet-geïndexeerde gegevens, kan het nodig zijn om "het" op te splitsen in beheersbare taken.)

Het implementeren van een metadatastrategie omvat doorgaans de volgende stappen en substappen:

Ontwikkel een metadatasjabloon: Op dit punt is het doel om te bepalen welke soorten metadata moeten worden gebruikt om de mogelijkheid om ontdekt te worden te maximaliseren. Dit vereist het verzamelen van informatie van mensen die de gegevens gebruiken over hoe de sjabloon het beste kan worden ontworpen. Tijdens deze fase van het verzamelen van informatie kunnen medewerkers worden geïnterviewd, kunnen klanten worden ondervraagd en kunnen workshops worden opgezet om input te krijgen van IT en belanghebbenden. Zorg ervoor dat u beoordeelt hoe klanten en zakelijke gebruikers hun eigen metadata taggen en identificeer gemeenschappelijke elementen. 

  • Identificeer de soorten metadata die moeten worden gebruikt: Hier is het doel om de soorten metadata te bepalen die: beste communiceren de inhoud en behoeften van het bedrijf (beschrijvend, structureel, administratief, referentie, statistisch, juridisch). Bepaal welke typen metadata het beste de data-assets van de organisatie beschrijven, inclusief gehele getallen, vrije tekst, tekenreeksen, de datum- of datum-/tijdvelden. Bepaal vervolgens of regels zijn nodig (titelvelden moeten bijvoorbeeld mogelijk worden beperkt tot 50 tekens, of de datum-/tijdvelden moeten mogelijk internationale weergavestandaarden gebruiken).
  • Stel een metadatavocabulaire op: Er moet een formele definitie van descriptoren worden ontwikkeld voor consistente communicatie van de metadata. Metadatavocabulaires zijn doorgaans gebaseerd op domeinspecifieke data. Metadata-elementen worden vaak gegroepeerd in categorieën, bijvoorbeeld klantgegevens, productgegevens en afbeeldingen. Het ontwikkelen van een metadata-woordenlijst om het vocabulaire te ondersteunen en kan helpen bij communicatie en zou ook deel moeten uitmaken van de Data Governance-strategie, die de nadruk legt op Datakwaliteit.
  • Let op de metadata van het onderwerp: Vreemd genoeg bevatten metadata … sub-metadata. De metadatastructuren van metadata hebben vaak hun eigen metadata. Dit kan een beschrijvende naam zijn of de lengte van tekens. Metadata van onderwerp is de juiste naam voor dit soort metadata. De descriptoren van metadata over een onderwerp kunnen worden gebruikt om records van bijdragende partners en instellingen te koppelen aan andere records, waardoor ze gemakkelijker te vinden zijn.

Breng de metadata in kaart: Maak een soort van traceerbare grafiek. Het kan een spreadsheet zijn of een tabel op een computer. Whiteboards zijn een optie, hoewel er maatregelen moeten worden genomen om te voorkomen dat ze per ongeluk worden gewist. Breng met behulp van de informatie uit de vorige stappen de metadata in kaart en geef aan waar en hoe deze worden gebruikt. 

  • Zoek na het opsommen van de metadata en de locaties naar gemeenschappelijke descriptoren. (Soms hebben descriptoren verschillende namen, maar dienen ze hetzelfde doel. Voor onderzoeksdoeleinden zouden ze kwalificeren als gemeenschappelijke descriptoren.) Onthoud dat het belangrijk is om gegevens te kunnen herleiden tot de oorspronkelijke bron (zoals een ERP- of CRM-systeem).
  • Maak een data catalogus. Een gegevenscatalogus is een georganiseerde inventaris van gegevensactiva voor een bedrijf. Deze catalogus moet regelmatig worden onderhouden en bijgewerkt.

Beoordeling: In dit stadium is het doel om te bepalen of er "tools" voor import/export, synchronisatie of masterdatabeheer nodig zijn om de metadata consistent en schoon te houden in het hele bedrijf. De volgende informatie zal nuttig zijn om te bepalen hoe de metadata ontworpen moet worden, en de soorten: metadatabeheertools aan onderzoek ter ondersteuning van de metadatastrategie. 

Begrijp de mensen en de processen: dit is een belangrijk onderdeel van de beoordelingsfase, die inhoudt dat u begrijpt hoe de processen werken, de problemen die mensen hebben en hun oplossingen. Hieronder vindt u enkele manieren om meer inzicht te krijgen in de mensen en de processen:

  • Houd bij hoe de gegevens door het bedrijf gaan. Zoek naar algemene descriptoren terwijl de gegevens binnen het systeem worden verplaatst.
  • Begrijp hoe de metadata wordt gebruikt. Wordt het gebruikt om formulieren in te vullen of om verbinding te maken met andere systemen? Zal het workflowprocessen initiëren?
  • Bepaal hoe de descriptoren zullen worden georganiseerd. Zal het proces voor het vastleggen van metagegevens het gebruik van een freestyle-methode voor het taggen van de inhoud toestaan ​​(genaamd "folksonomie”) of wordt het volledig geautomatiseerd?
  • Welke training of opleiding heeft het personeel nodig om zich soepel aan te passen aan de veranderingen? Hoe zal de opleiding tot stand komen?

Ontwerp het metadatamodel voor continue verbeteringen: Feedback is belangrijk voor de continue verbetering en evolutie van het metadatamodel. Het is cruciaal om feedback van uw personeel en klanten te verzamelen om ervoor te zorgen dat het metadataplan de bedrijfsdoelstellingen blijft ondersteunen. 

Hier zijn enkele aanbevelingen om continue verbetering in uw ontwerp op te nemen:

  • Neem regelmatig contact op met managers om toegang te krijgen tot de functionaliteit van het metadatamodel. 
  • Naarmate de bedrijfsdoelstellingen veranderen, moet mogelijk ook het metadatamodel veranderen.
  • Zorg voor een feedbackmechanisme voor iedereen met een suggestie of klacht over de metadata.

Automatiseer waar mogelijk: Er zijn drie fundamentele redenen voor automatisering. Het is veel, veel sneller; het elimineert menselijke fouten; en het zorgt er "automatisch" voor dat de taak wordt volbracht. Het automatiseren van metadata kan de tijd die wordt besteed aan taken zoals data tagging en catalogiseren aanzienlijk verminderen.

De voordelen van het implementeren van een metadatastrategie

Metadata is een belangrijke factor om de maximale waarde uit uw data te halen. Het zorgt voor dataconsistentie, ondersteunt Data Governance en helpt bij het naleven van regelgeving. Het ondersteunt ook het onderzoek dat wordt gebruikt bij het nemen van intelligente zakelijke beslissingen.

Het gebruik van realtime automatisering van metadata kan zowel uiterst nuttig als kosteneffectief zijn. Medewerkers hebben toegang tot de meest actuele gegevens, waardoor de efficiëntie en gegevenskwaliteit worden verbeterd (en betere beslissingen worden genomen). Automatisering kan worden gebruikt om gegevens te standaardiseren, classificeren en bevestigen. Als gevolg hiervan worden alle inconsistenties in de gegevens - en andere problemen - in realtime gecorrigeerd.

Waarschuwing: Er moet grondig onderzoek (en/of het inhuren van een consultant) worden gedaan voordat een metadatastrategie wordt geïmplementeerd. Tijd en geld verspillen aan tools die niet werken, is contraproductief. 

Afbeelding gebruikt onder licentie van Shutterstock.com

spot_img

Laatste intelligentie

spot_img