Logo Zéphyrnet

Meilleures pratiques de gestion des métadonnées – DATAVERSITY

Date :

L’utilisation des meilleures pratiques de gestion des métadonnées permet de maximiser la valeur des données stockées par une organisation. Trouver les bonnes données une fois qu'elles ont été stockées peut être difficile si le système de stockage n'a pas d'organisation. Les métadonnées sont utilisées pour organiser les données afin qu'elles puissent être trouvées facilement. 

Les métadonnées sont essentiellement un système d'étiquetage, similaire aux catalogues sur fiches utilisés par de nombreux usagers des bibliothèques lorsqu'ils recherchent des livres spécifiques sur les étagères des bibliothèques. Une certaine forme de métadonnées a été utilisée pour localiser des informations Pour des milliers d'années.

Les meilleures pratiques de gestion des métadonnées impliquent la mise en place d'un système permettant de gérer les métadonnées d'une organisation spécifique de manière utile et organisée.   

Les métadonnées utilisent des descriptions et des mots-clés associés au contenu d'un fichier, permettant à un moteur de recherche de le trouver facilement. Les métadonnées d'un fichier sont généralement basées sur des informations décrivant ou relatives au fichier, en utilisant des fonctionnalités telles que son nom, sa date, son auteur, son type et son emplacement. Ces fonctionnalités sont utilisées pour filtrer et organiser les fichiers.

En développant un système organisé de gestion des métadonnées et en utilisant le logiciel approprié, une entreprise peut garantir la localisation de ses informations.

Malheureusement, il n'existe pas beaucoup d'outils ou de plates-formes disponibles permettant de gérer réellement la structure des métadonnées. Les logiciels décrits comme étant destinés à la gestion des métadonnées sont souvent une plateforme qui utilise un moteur de recherche de métadonnées et fournit une variété de services – tels que le traçage des données, les définitions sémantiques et l'analyse d'impact – mais très peu dans la gestion réelle de la structure des métadonnées. 

Lorsqu'une entreprise utilise un système clair et bien organisé pour gérer ses métadonnées, les données nécessaires à la prise de décisions commerciales (l'intelligence d'entreprise) peuvent être localisés rapidement et facilement. Les métadonnées peuvent être générées automatiquement chaque fois que des données sont créées, modifiées ou mises à jour, mais elles peuvent également être créées ou modifiées manuellement. Cependant, la sélection des métadonnées utilisées doit être spécifique aux besoins de l'organisation. La sélection des métadonnées adaptées aux besoins spécifiques d'une organisation est une bonne pratique. 

Sans stratégie d’organisation et de gestion des métadonnées et de fourniture d’informations précises, les chances de prendre de mauvaises décisions augmentent. La stratégie de chaque organisation en matière de gestion des métadonnées sera unique. Le système de métadonnées/étiquetage utilisé dépend du type d’entreprise, ainsi que de ses objectifs et priorités.

Les meilleures pratiques de gestion des métadonnées suggèrent qu'une entreprise doit utiliser une structure de métadonnées conçue pour maximiser la valeur de ses données. 

Les métadonnées comme système de support

Un système de gestion des métadonnées bien conçu prend également en charge Gouvernance des donnéescatalogues de donnéeset sécurité. Les métadonnées peuvent être utilisées pour soutenir les efforts d'un programme de gouvernance des données visant à garantir des données de haute qualité en fournissant la source, la date, son historique et le nombre de copies. 

Il peut également être utilisé pour prendre en charge la création, la mise à jour et la maintenance d'un catalogue de données (inventaires organisés des actifs de données d'une organisation). Les métadonnées peuvent également être utilisées pour la sécurité des données, pour protéger les données sensibles et empêcher les utilisateurs non autorisés d'accéder aux données et de les modifier.

De plus, les métadonnées aident à fournir un contexte aux humains qui les utilisent au cours de la recherche. Par exemple, les métadonnées peuvent contenir le titre, une description, la date de dépôt, etc.

Exemples de métadonnées

Les métadonnées de mon ordinateur portable Mac OS (une sorte de pop-up accessible via « obtenir des informations ») fournissent un titre en haut (par exemple, « Images JPG » ou « roman robot ») suivi du « type » de document (JPEG, document texte enrichi, PDF, etc.). Ces informations sont suivies d'autres termes de référence, tels que taille, De (l'emplacement du fichier), créée (la date), et modifié (la date). 

Près du centre de la fenêtre contextuelle des métadonnées se trouvent les termes de référence Plus d'informations, nom et poste, commentaireset ouvert avec (le format du fichier : RTF, PDF, JPEG). Le bas de la fenêtre contextuelle des métadonnées contient un aperçu du fichier et partage et autorisations (sécurité, accès administratif). 

Ainsi, je peux retrouver des fichiers en recherchant le titre, la date de création, la date de dernière modification ou par emplacement. Les autres informations peuvent être utiles pour l’identification et la recherche.

La Initiative de métadonnées du Dublin Core a développé une liste de termes de référence normalisés de base et utiles (souvent appelés « éléments ») qui peuvent être utilisés pour créer un format de métadonnées. Ils sont présentés ci-dessous. Cependant, lors du développement d’un format de métadonnées, il n’y a aucune raison de se limiter à leurs termes. Lorsque vous développez votre propre cadre de métadonnées, n'hésitez pas à développer vos propres termes de référence personnalisés.

  • Contributeur
  • Couverture
  • Créateur
  • Date
  • Description
  • Format
  • Identifiant
  • Langue
  • Publisher
  • Rapport
  • Droits
  • Identifier
  • Sujet 
  • Titre
  • Type

Meilleures pratiques pour développer un programme de gestion des métadonnées

Théoriquement, le responsable de la gouvernance des données ou l'équipe de gouvernance des données sera responsable du développement et de la mise en œuvre d'un programme de gestion des métadonnées. Si l'organisation est suffisamment grande et/ou suffisamment occupée, un poste de gestionnaire de métadonnées devra peut-être être créé.

La gestion des métadonnées est utile dans maximiser la valeur des données d’une organisation. La mise en œuvre d'un programme de gestion des métadonnées peut apporter de nombreux avantages à une organisation. Il favorise la découverte et la compréhension des actifs de données de l'organisation, favorisant ainsi un travail plus productif et plus efficace. 

Les meilleures pratiques en matière de développement (ou de restructuration) d'un programme de gestion des métadonnées sont répertoriées ci-dessous :

1. Examiner les objectifs de l'organisation à des fins de clarté est une bonne première étape. Les bénéfices sont soutenus, en partie, par l’intelligence économique et l’efficacité. La business intelligence et l’efficacité sont soutenues, en partie, par un programme de gestion des métadonnées bien conçu. 

2. Établir les objectifs spécifiques du programme de métadonnées. Quel type d'entreprise avez-vous ? Les besoins d’information d’un hôpital sont différents de ceux d’une entreprise manufacturière. Dans le secteur manufacturier, il pourrait être utile de pouvoir accéder aux données sur les défauts d’une chaîne de montage, ainsi que leurs heures, dates et noms d’employés. Quel type de travail votre organisation effectue-t-elle ? 

3. Trouvez des moyens de modifier ou d'éditer les « éléments » de métadonnées. La sélection de termes/éléments de référence de métadonnées utiles et faciles à comprendre peut améliorer l’efficacité globale. Un logiciel de métadonnées automatisées est normalement intégré aux systèmes d'exploitation des ordinateurs (Mac, Linux, Windows) pour stocker des fichiers sur des disques durs de manière organisée. Cela rend la modification des éléments de métadonnées difficile, mais quelques tactiques sont disponibles.

CollectiveAccess (développé par Providence) est un logiciel open source qui peut fournir un système de gestion de métadonnées alternatif et modifiable, et Ça marche bien avec les systèmes Linux, Microsoft et Mac OS X 10.9+, mais nécessite également la prise en charge de la plateforme MySQL. 

Microsoft Word n'autorise pas la suppression ou la modification de ses « propriétés de document » (éléments) standard, mais il autorise pour l'ajout de nouveaux éléments/propriétés de document, qui peuvent être utilisés dans le même but.

4. Sélectionnez les meilleurs termes/éléments de référence. Déterminer quels termes de référence sont utilisés est important pour développer un programme de métadonnées efficace. Par exemple, les entreprises de vente au détail gagneraient à analyser les métadonnées liées à leurs ventes et aux commentaires des clients, afin d'identifier les tendances et de prendre des décisions sur les produits à acheter. En utilisant les termes de métadonnées pertinents, tels que le type de « produit » (chemise, robe), la « date de vente », la « taille », la « couleur » et le « nom de marque », les métadonnées peuvent être utilisées pour rechercher et améliorer les ventes en ligne de l'entreprise.

De plus, l’utilisation de «mots clés» dans les métadonnées permet aux acheteurs de localiser plus efficacement ce qu'ils recherchent.

D’un autre côté, un hôpital sélectionnerait des termes de métadonnées axés sur les patients et leur traitement. Ces métadonnées contiendraient le « nom » du patient, peut-être son « médecin », la date de sa « dernière visite », les « médicaments » qu'il prend et ses « problèmes de santé ».

5. Informez le personnel des changements. Le personnel doit être informé, et peut-être formé, de toute modification apportée à la structure des métadonnées ou à la manière dont le personnel les utilise. Toute liste de bonnes pratiques n’est pas complète si le personnel reste dans l’ignorance des changements.

Meilleures pratiques pour la maintenance de la gestion des métadonnées

La gestion des métadonnées n’est malheureusement pas une activité ponctuelle. Il doit être maintenu, ajusté et amélioré à mesure que l’organisation grandit et évolue. Les métadonnées sont utilisées pour prendre en charge la gouvernance des données, et de nombreuses compétences utilisées pour maintenir le programme de gouvernance des données sont similaires aux compétences nécessaires pour maintenir et prendre en charge la gestion des métadonnées.

Quelqu'un (de préférence le responsable ou l'équipe de la gouvernance des données) doit être chargé d'informer le personnel de toute modification apportée au système de métadonnées, de maintenir le système et d'éditer et de modifier le système de métadonnées, si nécessaire. Cette personne (et peut-être deux ou trois sauvegardes, juste au cas où quelque chose lui arriverait) devrait être la ou les seules à avoir accès au « système » des métadonnées pour empêcher les actes malveillants.

Effectuer des audits réguliers pour déterminer l'exactitude et la fonctionnalité de vos métadonnées peut aider à évaluer et à identifier les domaines nécessitant des améliorations. Les problèmes de maintenance des métadonnées les plus évidents sont :

  • Accumulation : S'assurer que des métadonnées précises sont jointes à tous les nouveaux enregistrements
  • Effacement: La suppression des enregistrements inutiles et de leurs métadonnées 
  • Modification: Modifier les métadonnées si nécessaire pour garantir leur exactitude
  • Partage: Copie et partage des données sélectionnées nécessaires à d'autres utilisations
  • Migration: Transférer des données d'un système d'architecture à un autre
  • Exposition: Rendre les données disponibles pour la recherche
  • Sécurité : Restreindre l'accès aux contrôles de métadonnées à des personnes sélectionnées

L'avenir de la gestion des métadonnées

Au cours d'une Entretien DATAVERSITY® à propos de l'avenir de la gestion des métadonnées, Emily Washington, vice-présidente principale de la gestion des produits chez Precisely, a déclaré : 

« Les informations sur les métadonnées doivent être actualisées à mesure que de nouveaux champs sont ajoutés aux systèmes ou que de nouvelles entrées et sorties circulent vers et depuis ceux-ci. De nombreuses automatisations permettent de gérer les métadonnées, en les gardant à jour, afin que les modifications, ajouts et suppressions puissent être vérifiés. L’apprentissage automatique et l’IA peuvent surveiller les tendances et l’utilisation historiques des métadonnées. Il peut déterminer, à partir des métadonnées, quelles données ont été touchées le plus fréquemment, où se trouvent les informations sensibles et où se trouvent les données redondantes.

Image utilisée sous licence Shutterstock

spot_img

Dernières informations

spot_img