ゼファーネットのロゴ

メタデータの種類とその管理方法

日付:

メタデータの種類メタデータの種類

近年、アクティブ メタデータ (パッシブ メタデータとは対照的に) により、新しいタイプのメタデータとそれらを管理する方法の開発が促進されています。 メタデータは、人間とコンピューターが読み取ることができるラベル付けシステムであり、定義されたメタデータ フィールドを使用して検索エンジンがデータを検索できるようにします。 

パッシブ メタデータは、技術情報を使用した基本的な識別システムを提供しますが、重要なコンテキストは提供せず、メタデータは静的 (半永久的なラベル) と見なされます。 幸いなことに、最新のデータ スタックにより、アクティブなメタデータの開発が促進されました。これは、新しいメタデータ記述システムとより多くのコンテキストをサポートし、動的 ​​(データが変更されるたびにメタデータが更新されることを意味します) と見なされます。 

アクティブなメタデータを使用するシステムは、 機械学習 そして自動化。 アクティブなメタデータ管理システムは、ソフトウェアを使用して、進行中のプロジェクトとリアルタイムの顧客サービスに使用されるメタデータの継続的な更新を促進します。 

また、データ パイプラインを移動するデータを追跡し、発生した変更を報告することもできます。 アクティブな メタデータ管理 システムには、メタデータ ラベルの継続的な処理と更新をサポートする自動化が必要です。 

アクティブなメタデータはソースからリアルタイムで取得されるため、管理者はデータ資産を識別、追跡、理解、および管理できます。 アクティブなメタデータ 信頼を築き、データを民主化します。

アクティブ メタデータ プラットフォーム

現代のビジネスは、 メタデータ戦略 これにより、データがサイロ化されず、メタデータ (パッシブとアクティブの両方) が正確で、一貫性があり、信頼できることが保証されます。 

アクティブなメタデータ プラットフォームにより、メタデータは全体を通してスムーズかつ迅速に流れることができます。 データスタック. これは、パッシブ メタデータよりも複雑なプロセスであり、さまざまなメタデータ記述システムをカバーしています。 

アクティブ メタデータ プラットフォームは、手動入力を必要とせずに、常にオンになっており、常にメタデータを収集しているアクション指向のシステムです。 メタデータを常に処理して、データ セットとファイルを相互接続し、そこからビジネス インテリジェンスを開発します。 機械学習を使用してメタデータを処理し、実用的なインテリジェンスを開発します。 

アクティブなメタデータ システムは、人々がそれを使用し、メタデータの経験を積むにつれて、よりスマートになります。

さまざまな種類のメタデータ

のいくつかの種類があります メタデータ、 これらはすべて、ビジネスのデータ資産の価値を高めるのに役立つ可能性があります。 アクティブなメタデータごとに開発されたさまざまなメタデータ タイプは、データのコンテンツを記述する際の柔軟性を大幅に高めます。 

最も基本的なレベルでは、メタデータはコンテンツ、コンテキスト、および構造に関する情報を伝達する必要があります。 より一般的なメタデータ タイプの一部を以下に示します。

技術メタデータ: このタイプのメタデータは、一般的にパッシブ メタデータで使用され、データベース テーブルの名前と列名、データ タイプ、データに関連する ETL ジョブ、データを参照するインデックスなどが含まれます。テクニカル メタデータには次のものが含まれます。

  • ファイル形式
  • ファイル名
  • スキーマ
  • データソース
  • 地理的な場所

ビジネス メタデータ: データの定義、ビジネス ルール、データの使用に関する制限、およびデータのコンテキストを提供します。 ビジネス メタデータは、技術者でなくても簡単に理解でき、共通言語を提供します。 ビジネス メタデータには次のものが含まれます。

  • タイムライン
  • ビジネス要件とモデル
  • ビジネス プロセス フロー
  • メトリック
  • ビジネス用語

運用メタデータ: この形式のメタデータには、データがいつ、どのように変換または作成されたかに関する情報が含まれています。 データがどのように使用されたかについての追加の詳細を提供します。 このメタデータの種類には、次の情報が含まれます。

  • 更新日
  • 読み込み日
  • 系統
  • データの状態

プロセス メタデータ: これは、データ ウェアハウスまたはデータ レイク内に格納される運用メタデータの下位区分です。 プロセス メタデータは、データをストレージにロードするプロセスの詳細を提供します。 このタイプの情報は、問題が発生した場合に役立ちます。 プロセス メタデータには、次のものが含まれる場合があります。

  • エラーログ
  • ジョブ実行ログ
  • 監査結果

来歴メタデータ: このメタデータ型は、データの出所と経時的な変更を追跡します。 データのトレーサビリティを提供するため、不正確なデータを見つけて削除し、改善することができます データ品質. 来歴メタデータには、次の情報が含まれる場合があります。

  • 権威
  • 変更ログ
  • 所有記録
  • バージョン記録

構造メタデータ: これにより、データの物理的な編成 (関係、タイプ、バージョン、およびその他の特性) に関する情報が提供されます。 構造データを使用して、データ ディクショナリを作成および維持できます。 構造メタデータのいくつかの形式は次のとおりです。

  • データ要素の種類
  • テーブル名
  • レコードサイズ

管理メタデータ: このタイプのメタデータは、 データガバナンス. データの信頼性を管理および確立するのに役立ちます。 管理メタデータには、保存、権利、および使用に関する情報を含めることができます。 誰がファイルを使用できるか、およびファイルをどのように使用できるかを制御します。 管理メタデータには、次のものを含めることができます。

  • 著作権情報と使用許諾契約
  • 著作権管理に関する技術データ
  • ユーザー制限
  • アクセス制御情報

ソーシャル メタデータ: これにより、人々がデータをどのように使用しているかについての有用な情報が得られます。 ソーシャル メタデータが提供するコンテキストを使用して、企業は広告や生産性を減らすか、維持するか、増やすかを決定できます。 ソーシャル メタデータには、次の情報が含まれます。

  • 著者の情報
  • 最もクエリされたテーブル
  • 使用頻度

アクティブなメタデータの管理

アクティブなメタデータを管理すると、データ検索が迅速かつ効率的になり、データ駆動型の意思決定に必要な洞察が得られます。 ビジネスには、メタデータを管理するための戦略が必要です。 インテリジェントな戦略がなければ、データは非常にまとまりがなく、研究者がデータの正確性を判断するのが難しくなり、その信頼性に疑問を抱く可能性があります. 

有効なメタデータ プログラムには、次のものを必ず含めてください。

機密データの自動分類: 機密データ (個人データなど) は、自動化によって保護されます。 プライバシー (およびその他の問題) に関する法規制は、人的エラーのリスクなしに、自動的に適切に分類されます。

ユーザーが既存のすべてのデータを可視化できれば、データを真に民主化できます。 しかし、この積極的なメタデータ管理により、企業は機密データを自動的に分類し、その一部を非表示にして、残りのデータを許可されたユーザーのみが表示できるようにすることができます。 (機密データに関するポリシーはカスタマイズ可能です。)

古くなったデータの消去: アクティブなメタデータ管理によってサポートされる有用なプロセスは、古い古いデータの体系的な削除です。 ドキュメントまたはデータのバッチが最後に使用された日付および/またはそれにアクセスしたスタッフの数を決定するように設定できます。 

60 日間アクセスされない場合、データ リソースは自動的にアーカイブされます。 過去 90 日間アクセスされていない場合は、自動的にパージできます。

ダウンストリーム エンドユーザー アラート: データベースが変更されたとき、または潜在的な異常が検出されたときに、適切な人に直接通知するようにアクティブなメタデータ管理を設定できます。 

不一致が見つかった場合は、すぐに作成者にたどり着き、その人にエラーを通知したり、すぐに修正したりできます。

最も頻繁に使用されるデータ資産の特定: アクティブなメタデータ管理を使用して、データ リソースごとにカスタマイズされた人気スコアを作成できます。 この人気スコアは、クエリ ログの使用情報、データの来歴、および ビジネス インテリジェンス ダッシュボード. 最も使用され、最も関連性の高いデータ リソースが、より頻繁に検索結果に表示されます。 

メタデータ管理の未来

BigID の CEO 兼共同創設者である Dimitri Sirota 氏は、アクティブなメタデータ ハブの使用は、 次の開発 アクティブなメタデータで。

その目標は アクティブなメタデータ ハブ 組織のデータを相互接続し、検索エンジンとして機能させることです。 これにより、組織のデータ エコシステム全体にアクセスできるようになり、自動化と機械学習を通じてデータ ソリューションが加速されます。 

アクティブなメタデータ ハブは、機械学習でサポートされているデータ カタログを使用します。 メタデータのオーケストレーションと強化を促進するように設計されています。 さらに、さまざまなソースから取得されたメタデータは、現在保存されているデータと相互接続され、他のデータ管理ツールと統合されます。 アクティブなメタデータ ハブにより、メタデータの交換、更新、および共有が可能になります。

Shutterstock.comからのライセンスに基づき使用されている画像

スポット画像

最新のインテリジェンス

スポット画像