ゼファーネットのロゴ

知識グラフがデータを効率的かつ強力に処理するための鍵となる理由

日付:

あなたの企業はAI採用曲線のどこに立っていますか? 私たちを取る AI調査 見つけ出す。


この投稿は、PersistentSystemsのシニアデータサイエンティストであるMuktaPaliwal博士によるものです。

人工知能のトピックに関するGartnerのクライアントからの問い合わせの50%が、グラフ技術の使用に関する議論に関係していると、市場調査会社は 10年のデータと分析のトレンドトップ2021。 すべての大企業は、利用可能なデータを活用して、大規模なビジネスを行うためのより多くの洞察をもたらしたいと考えています。 これを実現するために、接続されたデータは論理的なニーズになりました。これは、既存の組織データ内にコンテキストを導入して知識を作成するのに役立つためです。

企業は、絶えず進化するデータニーズのペースに直面する必要があります。 ナレッジグラフ 企業が従来のデータベースから離れ、自然言語処理、機械学習、セマンティクスの力を利用してデータをより有効に活用できるように支援します。

知識グラフとは何ですか?

ナレッジグラフ ドメインに関する相互に関連する事実のコレクションを表します。 基本的に、エンティティとリレーションは非構造化データから抽出され、トリプルの形式で保存されます:subject-predicate-object。 たとえば、「キャプテンマーベルは最強の復讐者です」というステートメントは、サブジェクト(キャプテンマーベル)、述語(最強)、オブジェクト(アベンジャー)に分割して、トリプル(キャプテンマーベル-最強-アベンジャーズ)、人気のマーベル映画のキャラクターであるアベンジャーズの知識グラフの他の関連エンティティと一緒に。

基本的に、これらの機能を使用して知識グラフを定義できます。1)ドメインの実際のエンティティを定義します。 (2)それらはそれらの間の関係を提供します。 (3)いくつかのスキーマを介して、エンティティとリレーションの可能なクラスのルールを定義します。 (4)それらは推論が新しい知識を推論することを可能にします。

知識グラフは、自動生成または人間が作成することができ、厳格なオントロジーで設計されているか、時間とともに進化している可能性があり、さまざまな形やサイズである可能性があり、企業またはオープンソースコミュニティによって開発されている可能性があります。 これらの違いに関係なく、複数のエンティティ間の明示的な関係がプロセスに役立つ場合に情報を簡単に抽出できるように、非構造化データを整理するのに役立ちます。

なぜ知識グラフを使用するのですか? 

A 知識グラフは自己記述的です、データを見つけてそれが何であるかを理解するための単一の場所を提供するため。 データの意味はグラフ自体のデータと一緒にエンコードされるため、セマンティクスという単語は知識グラフに関連付けられます。 知識グラフは、以下を提供することによって付加価値をもたらします。

  • コンテキスト: 知識グラフは、さまざまなタイプの情報をオントロジーと柔軟性に統合して、外出先で新しい派生知識を追加することにより、アルゴリズムにコンテキストを提供します。 ほとんどの従来の知識グラフは、さまざまなタイプの生データを同時に使用できます。
  • 効率化:必要なエンティティと関係が利用可能になると、知識グラフは、保存されたデータをクエリするための計算効率を提供し、洞察を生成するためのデータの効果的な使用をもたらします。
  • 説明可能:エンティティと関係の大規模なネットワークは、グラフ自体の中で利用可能なエンティティの意味を統合することにより、理解しやすさの問題に対する解決策を提供します。 このように、知識グラフは本質的に説明可能になります。

知識グラフを使用する場所

ガートナーの10年のデータと分析のトレンドトップ2021によると、知識グラフは 最新のデータと分析、ユーザーコラボレーション、機械学習モデル、説明可能なAIを強化および改善する機能を備えています。 グラフテクノロジーはデータと分析にとって新しいものではありませんが、使用方法に変化があります。 知識グラフは、機械学習とグラフテクノロジーを組み合わせて、AIに必要なコンテキストを提供します。

さまざまなソースからの複数の非構造化および半構造化データソースを統合する必要がある複雑な問題を解決するには、現実世界の複雑さを反映する、接続された再利用可能な柔軟なデータ基盤が必要です。 意味が豊富な接続されたデータにより、同じデータから複数の解釈が可能になります。これは、複雑なクエリに対する回答を取得して、より効率的に洞察を引き出すのに役立ちます。

組織は、次のような知識グラフのユースケースをますます多く特定しています。

不正の検出:不正な取引の特定は最も一般的な使用例であり、銀行、携帯電話の取引、政府の利益、および脱税に適用されます。 知識グラフを使用すると、保険金請求の詐欺、浪費、および不正使用の検出も強化されます。 機械学習と推論機能によって強化された知識グラフにより、企業は、大規模なネットワーク内の多くのリアルタイムの相互接続されたエンティティをトラバースすることにより、不正なパターンをより適切に特定できます。

創薬:創薬は非常に複雑で費用のかかるプロセスです。 知識グラフは、ドラッグリポジショニング、薬物相互作用、標的遺伝子疾患の優先順位付けなど、さまざまなタスクにわたってかなりの見込みがあることを示しています。 多数のオープンソースデータベースが公開された文献とともに統合され、巨大な生物医学知識グラフが作成されます。 これらのKGは、遺伝子、薬物、病気などのエンティティ間の関係をマイニングし、ダウンストリームアプリケーションで使用するのに非常に役立ちます。

セマンティック検索:A 知識グラフ エンティティの意味を格納します。 したがって、知識グラフを利用した検索は「セマンティック検索、」または意味が豊富な検索。 セマンティック検索は、インターネットや組織の内部システムを探索する際の検索結果の精度を向上させるために使用されます。 セマンティック検索が機能するために、適切にキュレートされた知識グラフとともに、テキスト分析およびインデックス作成技術の機能が使用されます。

レコメンダーシステム:レコメンダーシステムは、製品のパーソナライズされたレコメンデーションに対するユーザーの好みをモデル化するために開発されました。 レコメンデーションシステムの開発に使用されるさまざまなモデリング手法があります。 これらのシステムにはかなりのメリットがありますが、データの希薄性、コールドスタート、推奨事項の拡張性などの課題に悩まされています。 知識グラフベースのレコメンダーシステムは、これらの課題をある程度解決するのに役立ちます。 このアプローチでは、ユーザーエンティティとアイテムエンティティは複数の関係を介して接続されます。 この関係は、対象ユーザーの候補リストを取得するために使用され、対象ユーザーと推奨アイテムの間のパスは、推奨アイテムの説明として使用されます。

Mukta Paliwalは、PersistentSystemsのシニアデータサイエンティストです。 彼女はチームを率いて相談し、複数のビジネスドメインでAI/MLに基づく最先端のソフトウェアソリューションを作成して提供しています。 彼女は博士号を取得しています。 応用機械学習で。

VentureBeatの

VentureBeatの使命は、技術的な意思決定者が革新的なテクノロジーと取引についての知識を習得するためのデジタルタウンスクエアになることです。 私たちのサイトは、あなたが組織を率いるときにあなたを導くためのデータ技術と戦略に関する重要な情報を提供します。 以下にアクセスして、コミュニティのメンバーになることをお勧めします。

  • あなたが興味を持っている主題に関する最新情報
  • ニュースレター
  • ゲート付きのソートリーダーコンテンツと、次のような貴重なイベントへの割引アクセス 変換2021: もっと詳しく知る
  • ネットワーク機能など

会員になる


PlatoAi。 Web3の再考。 増幅されたデータインテリジェンス。

アクセスするには、ここをクリックしてください。

ソース:https://venturebeat.com/2021/06/28/why-knowledge-graphs-are-key-to-working-with-data-efficiently-powerfully/

スポット画像

最新のインテリジェンス

スポット画像