ゼファーネットのロゴ

グラフデータベース:人気の高まりに関する最新情報

日付:

グラフデータベースは、2006年にデータベース設計として認識されるようになりました。 ティムバーナーズリー 「リンクトデータ」と呼ばれる巨大なデータベースの概念を開発しました。 この概念はグラフストレージの基礎となり、組織、人、アイテムまたはエンティティがどのように関連付けられているか、または相互に「相互接続」されているか、および関係の性質を表示できます。 グラフデータベース そのデータとその接続を保存し、ネットワークデータを実用的な洞察に簡単に変換します。 さらに、グラフデータベースは通常NoSQLに基づいており、非常に簡単に拡張または拡張できます。 グラフデータベースはその設計により、相互接続の優れた分析を提供します。これは、マイニングデータの使用が最近増加していることを説明しています。

情報のいくつかの長方形グリッドを表示するリレーショナル(またはSQL)データベースは、多くの場合、標準のスプレッドシートに非常によく似ています。 各グリッドには、さまざまな種類の情報を保持するさまざまな数の行と列が表示されます。 (リレーショナルデータベースは矢印システムを使用できますが、これはかなりすぐに圧倒されて混乱します。) 非リレーショナル グラフデータベース、 一方、は、通常、接続を表す単純な矢印(多くの場合、関係を説明する矢印の上に単語があります)とともに名前付きバブル(組織、人、またはオブジェクトを表す)を表示します。 リレーショナルデータベースは、安価で正確で一貫性があるため、長年にわたって人気を維持しています。 ただし、リレーショナルデータベースでリレーションシップ(または結合)を確立するプロセスは、時間とコストがかかる可能性があります。

グラフデータベースの一般的な概要は次のとおりです。 ここ。 2014年以前は、グラフデータベースは一般に、リレーショナルデータベースよりも遅く、操作が難しく、はるかに制限されていると見なされていました。 さらに、それらは論理分析システムを構築するために設計された「学術」データベースであると見なされており、必ずしもビジネス目的に役立つとは限りません。 でも グラフデータベース 有用な結果を提供する可能性があります。一般に、それらは複雑で時間がかかり、ひどくユーザーフレンドリーではありませんでした。

2014年には、多くの技術革新がグラフデータベースの進化をサポートしました。 Neo4j (初期のオープンソースのグラフデータベースであり、今でも非常に人気があります)は、特定の種類の数学的グラフ処理で人気を博し始めました。 同時に、ハードウェア(クラウドコンピューティングによる)は、初期のパフォーマンスの課題の多くを解決するのに十分な速度を獲得していました。 2013年には、グラフクエリ言語( SPARQL)グラフデータベースの以前の問題の多くを解決するエディションが出ました。 さらに、JSONデータストア(CouchDBおよびMongoDB)の開発により、結合の処理が大幅に改善されました(データベースのコア要件ですが、グラフデータベースの場合は特に重要です)。

また、2014年頃から、企業レベルで苛立ちを募らせていた問題(メタデータ管理、マスターデータ管理、ナレッジナビゲーションなど)を解決する方法として、多くの企業がグラフデータベースの実験を開始しました。 最近では、機械学習アルゴリズムがに組み込まれています グラフデータベースの構築.

使いやすさ

奇妙な外観にもかかわらず、グラフデータベースは現在、従来の関係データベースよりも柔軟性があります。これは、アイテム間の関係が 単純な矢印で示されています、または「エッジ」。 矢印は、友情、ビジネス関係などを示すことができます。 バブルは、誰が何を好きか、またはビジネスの目標を示すことができます。

リレーショナルモデルで同じことを達成すると、
時間と費用のかかる結合を作成する必要があります。 さらに、スキーマ
SQLデータベースのを拡張して、追加のフィールドを含める必要があります。
これは、スケーラブルなグラフデータベースの大部分で簡単に実行できますが、
SQL形式にはスケーラビリティがありません。

グラフデータベースのアルゴリズム

グラフデータベースは、アルゴリズムを使用して、すべてのデータの並べ替えを容易にします。 この優れた例は、悪名高い「パナマ文書スキャンダル」、何千ものシェル会社を対象とした調査と発見がありました。 これらの「シェル」は、映画スター、犯罪者、そしてアイスランドの元首相であるシグムンドゥル・デビッド・ガンラウグソンでさえ、オフショア銀行口座にお金を隠すことを許可しました。 グラフデータベースとそのアルゴリズムの使用により、これらのシェル会社の調査が可能になりました。

2つの非常に人気 トラバーサルアルゴリズム 深さ優先探索(DFS)と幅優先探索(BFS)です。 深さ優先アルゴリズムは、開始ノードから終了ノードに移動し、クエリが応答されるまで、同じノードから開始して別のパスを使用して検索を繰り返します。 幅優先探索アルゴリズムは、一度にXNUMX層ずつグラフを探索することによって検索します。 グラフ全体が調べられるまで、開始ノードよりXNUMXレベル深いノードの検索を開始し、次にXNUMX番目のレイヤーのノードを探索し、次に深さXNUMXなどに移動します。 BFSは最短パスを見つけ、DFSはサブツリーのベースに移動してからバックトラックします。

原則として、個別の情報を探す場合は、深さ優先探索をお勧めします。 情報に基づいていない検索は、深さ優先の最も基本的なレベルです。 このタイプのアルゴリズムプロセスは、最後までパスを検索してから、開始ノードに戻り、そこで別のパスを試行します。 一方、情報に基づく検索では、バックトラックしないアルゴリズムを使用して検索の量を最小限に抑えるか、検索のパスとノードを選択する際にスクリーニングプロセスを使用します。 その結果、情報に基づく検索は、情報に基づいていない検索よりも迅速に実行されます。 ((グラフ走査 通常、情報に基づいた検索を実行します。)

人工知能、機械学習、グラフ
データベース

トレーニングに関して、グラフは次のコンテキストを提供できます 機械学習 (ML)および 人工知能 (AI)。 グラフテクノロジーは、データを接続し、関係を定義できます。 グラフ技術を使用してAIを強化するプロセスは、高度なAIおよびMLアプリケーションをトレーニングする効果的な方法を提供します。

さらに、グラフはAIが意思決定を行う方法の透明性を高めます。 このプロセスはAIの説明可能性と呼ばれます。 これらの利点により、グラフデータベースの使用に対する好みが高まっています。 トレーニング用 AIおよびMLアプリケーション。

Neo4jのチーフサイエンティストであるJimWebberは、
トピックについて次のように述べています。「機械学習アルゴリズムは、データサイエンティストが発見するのに役立ちます
データセットの意味、およびこれらの洞察は関係として表現することができます
グラフ内のノード間。 グラフデータベースは効率的なストレージを可能にし、
関係に関する情報のトラバーサル。 したがって、グラフデータは次のいずれかになります。
機械学習処理の入力または出力になります。」

人気のあるユースケース

競争力を維持するために、企業は単にデータポイントを収集する慣行をやめなければなりません。 データポイント間に存在する関係を「接続」し始める必要があります。 残念ながら、一般的なリレーショナルデータベース管理システム(RDBMS)は、データポイント間の関係を適切に処理しません。 表形式のSQL データモデル リジッドスキーマを使用すると、新しい接続を追加するのが困難になります。 これらのデータ関係を活用するには、グラフデータベースが必要です。

グラフデータベースは、
データポイント間に存在し、新しい種類のデータポイントを追加するのに十分な柔軟性があります
関係を築き、データモデルを適応させて新しいビジネス要件を可能にします。 たくさんの
変換者は、グラフデータベースをオンラインビジネスの未来と見なします。 これらは
最新のグラフデータベーステクノロジーの主な使用例:

  • 顧客360: 今期は 一般的に関連付けられている SalesForceを使用しますが、他の目的のグラフデータベースとしても使用できます。 人(ノード)とその関係(エッジ)に基づいて、顧客の広い視野を提供します。
  • 資産運用管理: この システムの種類 グラフデータベースは非常に簡単にスケーリングできるため、非常に便利です。 リレーショナルデータベース管理システムとは異なり、厳密な構造が付属していないため、ノード、エッジ、およびその他のプロパティを自由に追加できます。    
  • リアルタイムレコメンデーションエンジン: 対話するとき AmazonまたはNetflixを使用すると、ユーザーの閲覧および購入履歴が検索され、「あなたに類似」と指定されたユーザーがスキャンされます。 彼らの購入や興味に基づいて、映画やその他のアイテムを次に表示または購入することをお勧めします。 たとえば、iPhoneを購入した場合は、iPhoneのカバーが提案されることがあります。
  • マスターデータ管理とID管理: これは、「データサイロ。」 メタデータを使用して、データを追跡し、誰がデータを所有し、どのデータベースがデータを保存しているかを伝達します。 この状況では、実際のデータはグラフデータベースではなくSQLデータベースまたはLDAPデータベースに保存されます。
  • 不正検出: 不正検出、一般的に言って、かなりうまくいくようです。 アカウントについて不審なアクティビティの通知が送信され、アカウントの所有者(たとえば、クレジットカードを使用)は請求またはアクティビティを拒否できます。 これは、疑わしいアクティビティを探すグラフモデルのノードとエッジに沿ってクロールするように設計されたさまざまなアルゴリズムを使用して実現されます。

不正分析はサイバーセキュリティにも適用できます
侵入も。 これには、アナリストにのみ警告するという追加の利点があります。
時間を無駄にすることなく、本当に重要な懸念事項であるイベント
統計的吸虫に関するリソース。 (ハードコードされているのではなく、インテリジェンスを使用しています
しきい値。)

グラフデータベースの未来

グラフデータベース 人や物の間の関係を伝えるのに非常に効率的です。 ユーザーフレンドリーになるまで進化した今、パターンを予測する能力の完全な強みが探求されています。 このテクノロジーがより優れたものに置き換えられるまで、グラフデータベースの長所は探求され、進歩し続けます。

Shutterstock.comからのライセンスに基づき使用されている画像

出典:https://www.dataversity.net/graph-databases-updates-on-their-growing-popularity/

スポット画像

最新のインテリジェンス

スポット画像

私たちとチャット

やあ! どんな御用でしょうか?