Zephyrnet-logo

Waarom metadata een kritieke troef is voor opslag- en IT-managers - DATAVERSITEIT

Datum:

We leven in een datagedreven economie, maar wat onder de data ligt, is verborgen goud. Metadata, of data die data beschrijft, levert veel voordelen op voor storage- en IT-managers. Toch zijn metadata complex, omvangrijk en verspreid over een hybride cloudinfrastructuur. Het begrijpen en strategisch beheren van metadata als onderdeel van uw algemene dataopslagstrategie is centraal komen te staan ​​in het optimaliseren van ongestructureerd databeheer en gegevensbeheer praktijken in de hele organisatie.

Metadata voor bestands- en objectopslag uitleggen

Metadatabeheer omvat zowel standaardmetadata die door de meeste opslagsystemen worden gemaakt en bijgehouden, als uitgebreide attributen die op maat en specifiek zijn. Standaardmetadata zijn systeemattributen zoals wanneer het bestand is gemaakt, wie het heeft gemaakt, wat voor soort bestand het is, de grootte, wanneer het voor het laatst is geopend en wanneer het voor het laatst is gewijzigd. 

Geavanceerde metagegevens worden verschillend behandeld door omgevingen voor bestandsopslag en objectopslag. Bestandsopslag organiseert gegevens in maphiërarchieën, wat betekent dat u niet eenvoudig aangepaste metagegevensattributen kunt toevoegen. Objectopslag mist de hiërarchische directorystructuur van bestandsopslag, maar u kunt deze aanpassen. Een klinisch beeldbestand zou bijvoorbeeld alleen metagegevens bevatten, zoals aanmaakdatum, eigenaar, locatie en grootte. Maar als het wordt opgeslagen als een object, kunnen metagegevens demografische gegevens bevatten, zoals de naam, leeftijd en diagnose van de patiënt.

Idealiter maken metadata gebruik van zowel standaardattributen als aangepaste tags (door gebruikers of systemen), die context toevoegen. Een metadatatag kan bijvoorbeeld een project, gevoelige of PII-gegevens, demografische gegevens, locatie of financiële resultaten zoals kwartaalverkopen identificeren.

Voordelen van metadatabeheer voor ongestructureerde gegevensopslag

Waarom investeren in metadatabeheer voor dataopslag? Ten eerste brengen metadata structuur aan in ongestructureerde data, wat cruciaal is voor zoeken, datamobiliteit, beheer en analyse. Hieronder staan ​​enkele extra voordelen van metadatabeheer voor gegevensopslag ploegen: 

  • Krijg gegevenszichtbaarheid: Metadata levert meer informatie over uw gegevens, waardoor opslagteams inzicht krijgen in de belangrijkste gegevenseigenaren, de belangrijkste bestandstypen en -groottes, en gebruiksinformatie zoals de laatste toegangsdatum. Deze basisbestandskenmerken zijn een goed uitgangspunt om beslissingen te helpen nemen, zoals waar de gegevens moeten worden opgeslagen op basis van de bedrijfsprioriteit of om vragen te beantwoorden, zoals "Wie zijn de belangrijkste gegevenseigenaren op een afdeling?" Terwijl u metadata verrijkt, kunnen geautoriseerde gebruikers gegevens segmenteren en zoeken op basis van trefwoorden, zodat ze deze kunnen hergebruiken, verwijderen of verplaatsen.
  • Verbeter kostenbesparingen en besluitvorming voor gegevensopslag: Aangezien metadata de algehele zichtbaarheid en het begrip van uw gegevens verbeteren, kunt u ervoor zorgen dat ze altijd op het juiste moment op de juiste plaats zijn. Stel bijvoorbeeld een beleid in waarbij zodra een onderzoeksproject is afgerond, alle bestanden die zijn getagd met de projectnaam en gegevens worden gearchiveerd – waardoor kostbare, hoogwaardige opslag voor uw laatste meest actieve gegevens behouden blijft.
  • Naleving verbeteren: Door gereguleerde of gecontroleerde datasets, zoals PII-, IP- of FDA-gegevens, te taggen, kunt u door de hele onderneming zoeken om ervoor te zorgen dat gevoelige bestanden worden opgeslagen volgens de nalevingsregels. U kunt dit uitbreiden met intern bedrijfsbeleid, zoals hoe om te gaan met ex-werknemers of financiële gegevens of wanneer bestanden moeten worden verwijderd voor verwijdering.
  • Verbeter zoeken en workflows voor AI/ML: Metadatabeheer wordt steeds belangrijker in AI- en machine learning-initiatieven, waardoor data-eigenaren en belanghebbenden sneller belangrijke datasets kunnen vinden en naar de juiste locatie voor projecten kunnen verplaatsen. Met AI-tools die enorme sets van de juiste soort gegevens nodig hebben voor een project, zal de mogelijkheid om dit proces te automatiseren steeds belangrijker worden voor succesvolle AI/ML-resultaten.

Uitdagingen voor het beheer van metagegevens over ongestructureerde gegevens

Metadata is enorm omdat het volume en de verscheidenheid aan ongestructureerde gegevens – bestanden en objecten – enorm en moeilijk te ordenen zijn. Gegevens worden verspreid over on-premises en edge datacenters en clouds en opgeslagen in mogelijk veel verschillende systemen. Om metadata te benutten, heb je eerst een proces en tools nodig voor het beheren van data. 

Het beheren van metadata vereist zowel strategie als automatisering; het kiezen van de beste weg voorwaarts kan moeilijk zijn wanneer zakelijke behoeften voortdurend veranderen en gegevenstypen ook kunnen veranderen door het verzamelen van nieuwe gegevenstypen zoals IoT-gegevens, bewakingsgegevens, geospatiale gegevens en instrumentgegevens.

Het beheren van metadata naarmate deze groeit, kan ook problematisch zijn. Kun je te veel hebben? Een risico is een afname van de prestaties van bestandsopslag. Organisaties moeten nadenken over hoe ze dit kunnen verminderen; een grote onderneming die we kennen, is overgestapt van het taggen van metadata op bestandsniveau naar directoryniveau.

Metadata optimaliseren voor opslaginzichten en besparingen

Hoewel u kunt profiteren van de metadata die uw opslagsystemen automatisch aanmaken, bevat een optimaal plan samengestelde of verfijnde metadata die aanvullende informatie aan uw bestanden toevoegen. Hier zijn enkele overwegingen:

  • Ontwikkel een holistische metadatastrategie, die regels en richtlijnen bevat voor het gebruiken, zoeken naar en aanpassen van metadata. Dit kan ervoor zorgen dat metadata niet uit de hand lopen en op de juiste manier worden gebruikt. Een strategie kan beleid voor beveiliging en privacy bevatten, zoals scheiding van taken. In een sterk gereguleerd bedrijf kunnen gebruikers bijvoorbeeld de bestanden taggen waartoe ze toegang hebben, maar alleen bepaalde IT-gebruikers mogen worden geautoriseerd om actie uit te voeren op de gegevens zodra ze zijn getagd. Uw strategie moet doelen en gewenste resultaten voor metadatabeheer beschrijven. Het is een goed idee om een ​​tagging-taxonomie en/of metadatacatalogus te maken, zodat gebruikers weten wanneer ze welke tags moeten gebruiken.
  • Beslis over tagging op directory-/mapniveau versus tagging op bestandsniveau. De eerste is eenvoudiger te beheren, omdat het het aantal tags vermindert dat u moet maken, volgen, opslaan en beheren. U kunt bijvoorbeeld alle bestanden met betrekking tot één programma binnen een geïntegreerde marketingcampagne verzamelen in een map en een gegevensbeheersysteem gebruiken om het automatisch als zodanig te labelen. Wees echter ijverig met de inhoud van de directory om ervoor te zorgen dat er geen foutieve bestanden in de directory zijn beland en nu op ongepaste wijze worden getagd.
  • Verrijk metadata met aangepaste tagging: Er zijn veel use-cases, van juridisch tot onderzoek tot marketing tot productontwikkeling, waarbij het handig is om extra metadatatags aan bestanden toe te voegen. Een biotechbedrijf dat bijvoorbeeld een experiment uitvoert in München en een in Palo Alto, zou voor elk van die experimenten tags kunnen maken, zodat een onderzoeker die aanvullende analyses wil uitvoeren later de specifieke bestanden kan selecteren op de specifieke locatie die ze nodig heeft. Metadataverrijking gaat het makkelijkst met behulp van ongestructureerde datamanagementsoftware. Anders hebt u een database nodig om metadatatags en -beleid op te slaan en bij te houden en is alle tagging handmatig. Dit vereist zware manuren, dus overweeg of u het personeel heeft om het te doen.
  • Samenwerken met data-stakeholders: IT- en opslagmanagers hebben doorgaans geen inzicht in de gegevens, maar beheren eerder opslag en bestandstoegang. IT moet vertrouwen op datawetenschappers en data-eigenaren om data nauwkeurig te taggen. U hebt een proces nodig voor collaboratief beheer van metadatatags.
  • Automatisering van metadatabeheer: Het is ten zeerste aan te raden om waar mogelijk automatisering te gebruiken, gezien het huidige volume en de verscheidenheid aan metadata. Dit kunt u doen met uw bestaande storage oplossingen, met Data Governance software zoals master data management of data catalog software en/of met ongestructureerde Data Management oplossingen. Er zijn kanttekeningen: opslagoplossingen hebben enkele metadatafuncties, maar deze zijn beperkt tot de bestanden in dat systeem; u moet meerdere metadataprocessen en -tools in alle opslag onderhouden en integreren. Bovendien kunt u met bestandsopslagsystemen geen metagegevens aan bestanden toevoegen of bewerken. Overweeg, afhankelijk van uw doelen en de diversiteit van uw opslaginfrastructuur, een uniforme oplossing die alle data en metadata kan doorzoeken om uw inspanningen te centraliseren. 
  • Gebruik tools die query's en tagging combineren: Tools voor metadatabeheer mogen tags niet te veel gebruiken en gebruikers tags laten genereren voor informatie die al in metadata beschikbaar is. Dit is omslachtig voor gebruikers en leidt tot tagproliferatie, tagconflicten en schaalproblemen. Oplossingen moeten ook de mogelijkheid bieden om query's te bouwen en op te slaan die zowel standaard als uitgebreide metadata combineren. Deze query-plus-tagbenadering zorgt voor efficiënte automatisering, schaalbaarheid en minimaliseert handmatige inspanning voor gebruikers.

Naarmate de ongestructureerde datavolumes groeien, moeten IT- en opslagmanagers de chaos en de kosten beheersen, en dat geldt ook voor de metadata. De optimale metadatabeheerstrategie omvat nauwe samenwerking met bedrijfs- en beveiligingsteams op het gebied van databeheer en analysebehoeften, taggingtools om de metadata te verrijken en automatisering om deze te analyseren en te volgen. Met enige inspanning en de juiste investering kunt u de onbetaalbare voordelen van grotere kostenbesparingen en langetermijnwaarde halen uit uw bergen ongestructureerde data en metadata.

spot_img

Home

LifeSciVC

Laatste intelligentie

spot_img

Chat met ons

Hallo daar! Hoe kan ik u helpen?