Zephyrnet-logo

Best practices voor metadatabeheer – DATAVERSITY

Datum:

Het gebruik van best practices voor metadatabeheer helpt de waarde van de gegevens die door een organisatie zijn opgeslagen te maximaliseren. Het vinden van de juiste gegevens nadat deze in de opslag zijn geplaatst, kan lastig zijn als het opslagsysteem geen organisatie heeft. Metadata wordt gebruikt om de gegevens zo te organiseren dat ze gemakkelijk gevonden kunnen worden. 

Metadata is in wezen een etiketteringssysteem, vergelijkbaar met kaartcatalogi die door veel bibliotheekbezoekers worden gebruikt bij het zoeken naar specifieke boeken in bibliotheekplanken. Er is gebruik gemaakt van een bepaalde vorm van metadata informatie lokaliseren voor duizenden jaren.

De beste praktijken op het gebied van metadatabeheer omvatten het opzetten van een systeem voor het op een nuttige en georganiseerde manier omgaan met de metadata van een specifieke organisatie.   

Metadata maakt gebruik van beschrijvingen en trefwoorden die verband houden met de inhoud van een bestand, waardoor een zoekmachine het bestand gemakkelijk kan vinden. De metagegevens van een bestand zijn doorgaans gebaseerd op informatie die het bestand beschrijft of er verband mee houdt, waarbij gebruik wordt gemaakt van kenmerken zoals de naam, datum, auteur, type en locatie. Deze functies worden gebruikt om de bestanden te filteren en te ordenen.

Door een georganiseerd systeem te ontwikkelen voor het beheer van metadata en de juiste software te gebruiken, kan een bedrijf ervoor zorgen dat zijn informatie kan worden gelokaliseerd.

Helaas zijn er niet veel tools of platforms beschikbaar die het daadwerkelijke beheer van de metadatastructuur mogelijk maken. Software waarvan wordt beschreven dat deze bedoeld is voor metadatabeheer, is vaak een platform dat gebruikmaakt van een metadata-zoekmachine en een verscheidenheid aan diensten levert – zoals data-afstamming, semantische definities en impactanalyse – maar heel weinig voor het daadwerkelijke beheer van de structuur van de metadata. 

Wanneer een bedrijf een duidelijk, goed georganiseerd systeem gebruikt voor het beheren van zijn metadata, worden de gegevens die nodig zijn voor het nemen van zakelijke beslissingen (business intelligence) kan snel en eenvoudig worden gelokaliseerd. Metagegevens kunnen automatisch worden gegenereerd wanneer gegevens worden gemaakt, gewijzigd of bijgewerkt, maar kunnen ook handmatig worden gemaakt of gewijzigd. De selectie van de gebruikte metadata moet echter specifiek zijn voor de behoeften van de organisatie. Het selecteren van de juiste metadata voor de specifieke behoeften van een organisatie is een best practice. 

Zonder een strategie voor het organiseren en beheren van de metadata en het verstrekken van nauwkeurige informatie neemt de kans op het nemen van slechte beslissingen toe. De strategie van elke organisatie voor het beheren van metadata zal uniek zijn. Het gebruikte metadata-/labelingsysteem is afhankelijk van het type bedrijf, maar ook van de doelstellingen en prioriteiten ervan.

Best practices voor metadatabeheer suggereren dat een bedrijf een metadatastructuur moet gebruiken die is ontworpen om de waarde van zijn gegevens te maximaliseren. 

Metadata als ondersteuningssysteem

Een goed ontworpen metadatabeheersysteem ondersteunt ook Gegevensbeheergegevenscatalogi en veiligheid. Metagegevens kunnen worden gebruikt ter ondersteuning van de inspanningen van een Data Governance-programma om gegevens van hoge kwaliteit te garanderen door de bron, de datum, de geschiedenis ervan en het aantal exemplaren te verstrekken. 

Het kan ook worden gebruikt ter ondersteuning van het maken, bijwerken en onderhouden van een gegevenscatalogus (georganiseerde inventarissen van de gegevensassets van een organisatie). Metadata kunnen ook worden gebruikt bij gegevensbeveiliging, om gevoelige gegevens te beschermen en te voorkomen dat ongeautoriseerde gebruikers toegang krijgen tot de gegevens en deze kunnen wijzigen.

Bovendien helpen metadata om context te bieden aan mensen die deze tijdens onderzoek gebruiken. Metagegevens kunnen bijvoorbeeld de titel, een beschrijving, de datum waarop ze zijn opgeslagen, enz. bevatten.

Voorbeelden van metadata

De metagegevens van mijn Mac OS-laptop (een soort pop-up die toegankelijk is via "get info") bevat bovenaan een titel (bijvoorbeeld "Afbeeldingen JPG" of "robotroman") gevolgd door het "soort" document (JPEG, rich-text-document, PDF, enz.). Deze informatie wordt gevolgd door andere referentietermen, zoals grootte, WAAR (de bestandslocatie), aangemaakt (de datum), en gewijzigd (de datum). 

In het midden van de metadata-pop-up staan ​​de referentietermen meer informatie, naam & extensie, opmerkingen en openen met (het bestandsformaat: RTF, PDF, JPEG). De onderkant van de metadata-pop-up bevat een voorbeeld van het bestand en delen en machtigingen (beveiliging, administratieve toegang). 

Hierdoor kan ik bestanden vinden door te zoeken op de titel, de aanmaakdatum, de laatste wijzigingsdatum of op locatie. De overige informatie kan nuttig zijn voor identificatie en onderzoek.

De Dublin Core Metadata-initiatief heeft een lijst met nuttige, gestandaardiseerde referentietermen ontwikkeld (vaak “elementen” genoemd) die kunnen worden gebruikt voor het creëren van een metadataformaat. Ze worden hieronder weergegeven. Bij het ontwikkelen van een metadataformaat is er echter geen reden om je te beperken tot de voorwaarden ervan. Wanneer u uw eigen metadataframework ontwikkelt, kunt u gerust uw eigen unieke, op maat gemaakte referentietermen ontwikkelen.

  • Bijdrager
  • Dekking
  • Schepper
  • Datum
  • Omschrijving
  • Formaat
  • Identifier
  • Taal
  • Uitgever
  • Relatie
  • Rechten
  • bron
  • Onderwerp 
  • Titel
  • Type

Best practices voor het ontwikkelen van een metadatabeheerprogramma

Theoretisch zal de Data Governance steward of het Data Governance team verantwoordelijk zijn voor het ontwikkelen en implementeren van een metadata management programma. Als de organisatie groot genoeg en/of druk genoeg is, kan het nodig zijn dat er een functie als metadatamanager wordt gecreëerd.

Metagegevensbeheer is nuttig bij maximaliseren van de waarde van de gegevens van een organisatie. Het implementeren van een metadatabeheerprogramma kan een organisatie tal van voordelen opleveren. Het bevordert de ontdekking en het begrip van de datamiddelen van de organisatie, waardoor productiever en efficiënter werken wordt ondersteund. 

De best practices bij het ontwikkelen (of herstructureren) van een metadatabeheerprogramma worden hieronder opgesomd:

1. Het herzien van de doelstellingen van de organisatie met het oog op duidelijkheid is een goede eerste stap. De winsten worden gedeeltelijk ondersteund door business intelligence en efficiëntie. Business intelligence en efficiëntie worden gedeeltelijk ondersteund door een goed ontworpen metadatabeheerprogramma. 

2. Bepaal de specifieke doelstellingen van het metadataprogramma. Wat voor soort bedrijf heeft u? De informatiebehoeften van een ziekenhuis zijn anders dan die van een productiebedrijf. In de productie kan het nuttig zijn om toegang te hebben tot gegevens over defecten in een assemblagelijn, samen met de tijden, datums en naam van de werknemer. Wat voor soort werk voert uw organisatie uit? 

3. Vind manieren om de metadata-‘elementen’ te wijzigen of te bewerken. Het selecteren van nuttige en gemakkelijk te begrijpen metadata-referentietermen/-elementen kan de algehele efficiëntie verbeteren. Geautomatiseerde metadatasoftware wordt normaal gesproken ingebouwd in de besturingssystemen van computers (Mac, Linux, Windows) om bestanden op een georganiseerde manier op harde schijven op te slaan. Dit maakt het bewerken van de metadata-elementen moeilijk, maar er zijn een paar tactieken beschikbaar.

CollectiveAccess (ontwikkeld door Providence) is open-sourcesoftware die een alternatief en bewerkbaar metadatabeheersysteem kan bieden, en het werkt goed met Linux-, Microsoft- en Mac OS X 10.9+ systemen, maar vereist ook de ondersteuning van het MySQL-platform. 

Microsoft Word staat niet toe dat de standaard “documenteigenschappen” (elementen) worden verwijderd of gewijzigd, maar het staat het wel toe voor de toevoeging van nieuwe elementen/documenteigenschappen, die voor hetzelfde doel kunnen worden gebruikt.

4. Selecteer de beste referentietermen/-elementen. Het bepalen welke referentietermen worden gebruikt, is belangrijk voor het ontwikkelen van een efficiënt metadataprogramma. Retailbedrijven zouden bijvoorbeeld baat hebben bij het analyseren van de metadata met betrekking tot hun verkopen en klantenfeedback, als een manier om trends te identificeren en beslissingen te nemen over welke producten worden gekocht. Door gebruik te maken van de relevante metadatatermen, zoals het type ‘product’ (shirt, jurk), de ‘verkoopdatum’, de ‘maat’, de ‘kleur’ en de ‘merknaam’, kunnen metadata worden gebruikt voor onderzoek en de online verkoop van het bedrijf verbeteren.

Bovendien is het gebruik van “trefwoorden' binnen de metadata zorgt ervoor dat shoppers efficiënter kunnen vinden wat ze zoeken.

Aan de andere kant zou een ziekenhuis metadatatermen selecteren die gericht zijn op patiënten en hun behandeling. Deze metagegevens bevatten de ‘naam’ van de patiënt, misschien hun ‘arts’, de datum van hun ‘laatste bezoek’, eventuele ‘medicijnen’ die ze gebruiken en ‘gezondheidsproblemen’.

5. Breng het personeel op de hoogte van wijzigingen. Het personeel moet op de hoogte worden gesteld, en wellicht ook worden opgeleid, over eventuele wijzigingen in de metadatastructuur, of over de manier waarop het personeel deze gebruikt. Elke lijst met best practices is niet compleet als het personeel in het ongewisse blijft over de veranderingen.

Best practices voor onderhoud van metadatabeheer

Metadatabeheer is helaas geen eenmalige activiteit. Het moet worden onderhouden, aangepast en verbeterd naarmate de organisatie groeit en evolueert. Metadata wordt gebruikt bij het ondersteunen van Data Governance, en veel van de vaardigheden die worden gebruikt bij het onderhouden van het Data Governance-programma zijn vergelijkbaar met de vaardigheden die nodig zijn om metadatabeheer te onderhouden en te ondersteunen.

Iemand (bij voorkeur de Data Governance-steward of het Data Governance-team) moet de verantwoordelijkheid krijgen voor het informeren van het personeel over eventuele wijzigingen in het metadatasysteem, het onderhouden van het systeem en het bewerken en wijzigen van het metadatasysteem, indien nodig. Deze persoon (en misschien twee of drie back-ups, voor het geval er iets met die persoon gebeurt) zou de enige moeten zijn die toegang heeft tot het “systeem” van de metadata om kwaadwillige handelingen te voorkomen.

Het regelmatig uitvoeren van audits om de juistheid en functionaliteit van uw metadata te bepalen, kan helpen bij het beoordelen en identificeren van gebieden die verbetering behoeven. De meest voor de hand liggende problemen met het onderhoud van metadata zijn:

  • Opbouw: Ervoor zorgen dat nauwkeurige metagegevens aan alle nieuwe records worden toegevoegd
  • verwijdering: Het verwijderen van onnodige records en hun metadata 
  • Wijziging: Metagegevens indien nodig wijzigen om de nauwkeurigheid ervan te garanderen
  • Delen: Kopiëren en delen van geselecteerde gegevens die nodig zijn voor ander gebruik
  • Migratie: Gegevens overbrengen van het ene architectuursysteem naar het andere
  • Blootstelling: Het beschikbaar stellen van data voor onderzoek
  • Veiligheid: Beperking van de toegang tot metadatacontroles tot geselecteerde personen

De toekomst van metadatabeheer

Tijdens DATAVERSITY®-interview over de toekomst van metadatabeheer zei Emily Washington, Precisely's senior VP productmanagement: 

“Metadata-informatie moet worden vernieuwd als er nieuwe velden aan systemen worden toegevoegd of als er nieuwe invoer en uitvoer van en naar systemen stroomt. Veel automatisering helpt bij het beheren van metadata en houdt deze up-to-date, zodat wijzigingen, toevoegingen en verwijderingen kunnen worden gecontroleerd. Machine learning en AI kunnen historische trends en gebruik van metadata monitoren. Het kan uit metadata achterhalen welke gegevens het vaakst zijn aangeraakt, waar gevoelige informatie zich bevindt en waar overtollige gegevens voorkomen.”

Afbeelding gebruikt onder licentie van Shutterstock

spot_img

Laatste intelligentie

spot_img