ゼファーネットのロゴ

ベクトル埋め込みとは何ですか? | TechTarget による定義

日付:

ベクトル埋め込みとは何ですか?

ベクトル埋め込みは、単語、フレーズ、その他のデータ型の関係と意味をキャプチャする数値表現です。ベクトル埋め込みを通じて、オブジェクトの本質的な特性や機能が簡潔で組織化された数値の配列に変換され、コンピューターが情報を迅速に取得できるようになります。同様のデータ ポイントは、多次元空間内のポイントに変換された後、より近くにクラスター化されます。

幅広いアプリケーション、特に自然言語処理で使用されます (NLP)と機械学習(ML)、ベクトル埋め込みは、類似性の比較、クラスタリング、分類などのタスクでデータを操作および処理するのに役立ちます。たとえば、テキストデータを見ると、次のような単語が表示されます。 cat & キティ 文字の構成の違いにもかかわらず、同様の意味を伝えます。効果的な意味検索は、用語間のこの意味上の類似性を適切に捉える正確な表現に依存します。

[埋め込まれたコンテンツ]

エンベディングとベクターは同じものですか?

用語 ベクトル & 埋め込み ベクトル埋め込みのコンテキストでは同じ意味で使用できます。どちらも数値データ表現を指します。 データポイント 高次元空間ではベクトルとして表現されます。

ベクトルは定義された次元を持つ数値の配列を指しますが、ベクトル埋め込みはこれらのベクトルを使用して連続空間内のデータ ポイントを表します。

この記事は

埋め込みとは、重要な情報、セマンティック リンク、コンテキスト上の品質、またはトレーニング アルゴリズムを通じて学習されたデータの組織化された表現をキャプチャするために、データをベクトルとして表現することを指します。 機械学習モデル.

ベクトル埋め込みの種類

ベクトル埋め込みにはさまざまな形式があり、それぞれにさまざまな種類のデータを表すための個別の機能があります。以下に、一般的なベクトル埋め込みのタイプをいくつか示します。

  • 単語の埋め込み。 単語の埋め込みは、連続空間内の個々の単語のベクトル表現です。これらは、次のようなタスクで単語間の意味上のリンクをキャプチャするためによく使用されます。 感情分析、言語翻訳と単語の類似性。
  • 文の埋め込み。 完全な文のベクトル表現は文埋め込みと呼ばれます。これらは文の意味とコンテキストを捉えるため、感情分析、テキストの分類、情報検索などのタスクに役立ちます。
  • ドキュメントの埋め込み。 ドキュメントの埋め込みは、記事やレポートなどのドキュメント全体のベクトル表現です。通常、文書の類似性、クラスタリング、推奨システムなどのタスクで使用され、文書の一般的な意味と内容を取得します。
  • ユーザー プロファイル ベクトル。 これらは、ユーザーの好み、行動、または特性をベクトルで表現したものです。で使用されています 顧客セグメンテーション、パーソナライズされた推奨システム、およびユーザー固有のデータを収集するためのターゲットを絞った広告。
  • 画像ベクトル。 これらは、画像やビデオ フレームなどのビジュアル アイテムのベクトル表現です。これらは次のようなタスクで使用されます。 物体認識、画像検索およびコンテンツベースの推奨システムを使用して、視覚的な特徴をキャプチャします。
  • 積ベクトル。 製品またはアイテムをベクトルとして表すこれらは、製品間の特徴や類似点を収集するために、製品検索、製品分類、推奨システムで使用されます。
  • ユーザー プロファイル ベクトル。 ユーザー プロファイル ベクトルは、ユーザーの好み、行動、または特性を表します。これらはユーザーのセグメンテーション、パーソナライズされた推奨システム、 ターゲット広告 ユーザー固有のデータを収集するため。

ベクトル埋め込みはどのように作成されますか?

ベクトル埋め込みは、モデルをトレーニングしてデータを数値ベクトルに変換する ML アプローチを使用して生成されます。通常、深い たたみ込みニューラルネットワーク は、これらのタイプのモデルをトレーニングするために使用されます。結果として得られる埋め込みは、多くの場合、高密度 (すべての値がゼロ以外) で、高次元 (最大 2,000 次元) になります。 Word2Vec、GLoVE、 ベルト 単語、フレーズ、段落をテキスト データのベクトル埋め込みに変換します。

このプロセスには通常、次の手順が含まれます。

  1. 大規模なデータセットを組み立てます。 埋め込みが対象となる特定のデータ カテゴリ (テキストに関するものであるか、画像に関するものであるか) をキャプチャするデータ セットが組み立てられます。
  2. データを前処理します。 データの種類に応じて、クリーニング、準備、 データ前処理 ノイズの除去、写真のサイズ変更、テキストの正規化、および追加の操作の実行が含まれます。
  3. モデルをトレーニングします。 データ内のリンクとパターンを識別するために、データセットを使用してモデルがトレーニングされます。ターゲット ベクトルと予測ベクトルの間の差異を減らすために、事前トレーニングされたモデルのパラメーターはトレーニング フェーズ中に変更されます。
  4. ベクトル埋め込みを生成します。 トレーニング後、モデルは新しいデータを数値ベクトルに変換し、元のデータの意味情報を効果的にカプセル化する意味のある構造化された表現を提示できます。

ベクトル埋め込みは、時系列データ、テキスト、画像、オーディオ、 三次元 (3D) モデル そしてビデオ。埋め込みの形成方法により、同様のセマンティクスを持つオブジェクトは、ベクトル空間内で互いに近いベクトルを持ちます。

ベクトル埋め込みはどこに保存されますか?

ベクトル埋め込みは、として知られる特殊なデータベース内に保存されます。 ベクトルデータベース。これらのデータベースは、データ特徴を高次元で数学的に表現したものです。標準のスカラーベースのデータベースや独立したベクトル インデックスとは異なり、ベクトル データベースは、大規模なベクトル エンベディングの保存と取得に特有の効率を提供します。これらは、ベクトル検索機能のために大量のデータを効果的に保存および取得する機能を提供します。

ベクター データベースには、パフォーマンスや フォールトトレランス。ベクトル データベースのフォールト トレラント性を確保するには、レプリケーションと シャーディング テクニックが使われています。レプリケーションは多数のノードにわたってデータのコピーを作成するプロセスですが、シャーディングはデータを複数のノードにわたって分割するプロセスです。これにより、ノードに障害が発生した場合でも、フォールト トレランスと中断のないパフォーマンスが提供されます。

ベクトル データベースは機械学習と人工知能に効果的です (AI) アプリケーションは管理に特化しているため、 非構造化データと半構造化データ.

ベクトル埋め込みの応用

ベクトル埋め込みには、さまざまな業界でさまざまな用途があります。ベクトル埋め込みの一般的な用途には次のものがあります。

  • レコメンデーションシステム。 ベクター埋め込みは、Netflix や Amazon などの業界大手のレコメンデーション システムにおいて重要な役割を果たしています。これらの埋め込みにより、組織はユーザーとアイテム間の類似性を計算し、ユーザーの好みやアイテムの特徴をベクトルに変換できるようになります。このプロセスは、個々のユーザーの好みに合わせてカスタマイズされた提案を提供するのに役立ちます。
  • サーチエンジン。 検索エンジン ベクトル埋め込みを広範囲に使用して、情報検索の有効性と効率を向上させます。ベクトル埋め込みはキーワードの一致を超えているため、検索エンジンが単語や文章の意味を解釈するのに役立ちます。正確なフレーズが一致しない場合でも、検索エンジンは単語を意味空間内のベクトルとしてモデル化することで、文脈的に関連する文書やその他の情報を検索して取得できます。
  • チャットボットと質問応答システム。 ベクトル埋め込み支援 チャットボットと生成型 AI ベースの質問応答システム 人間のような反応の理解と生成において。埋め込みはテキストのコンテキストと意味をキャプチャすることで、チャットボットが意味のある論理的な方法でユーザーの問い合わせに応答するのに役立ちます。たとえば、言語モデルや AI チャットボットなどです。 GPT-4 および画像プロセッサなど ドール-E2、人間のような会話や応答を生み出すことで絶大な人気を集めています。
  • 不正行為の検出と異常値の検出。 ベクトル埋め込みを使用すると、ベクトル間の類似性を評価することで、異常や不正行為を検出できます。埋め込み間の距離を評価し、特定することで、珍しいパターンを特定します。 異常値.
  • データの前処理。 変換するには 未処理のデータを ML に適した形式に変換する および深層学習モデルでは、データの前処理アクティビティで埋め込みが使用されます。たとえば、単語の埋め込みは単語をベクトルとして表すために使用され、テキスト データの処理と分析が容易になります。
  • ワンショット学習とゼロショット学習。 ワンショット学習とゼロショット学習は、限定されたラベル付きデータが提供された場合でも、機械学習モデルが新しいクラスの結果を予測するのに役立つベクトル埋め込みアプローチです。モデルは、エンベディングに含まれるセマンティック情報を使用することで、少数のトレーニング インスタンスでも一般化して予測を生成できます。
  • 意味的な類似性とクラスタリング。 ベクトル埋め込みを使用すると、高次元環境で 2 つのオブジェクトがどの程度類似しているかを簡単に測定できます。これにより、意味的な類似性の計算、埋め込みに基づいた関連するもののクラスタリングや組み立てなどの操作を行うことが可能になります。
Image showing vector embedding in chatbots.
埋め込みにより、チャットボットは有意義かつ論理的な方法でユーザーの問い合わせに応答できるようになります。

どのようなものを埋め込むことができますか?

ベクトル埋め込みを使用すると、さまざまな種類のオブジェクトやデータ型を表現できます。埋め込み可能な一般的なタイプは次のとおりです。

テキスト

単語、フレーズ、またはドキュメントは、テキスト埋め込みを使用してベクトルとして表されます。感情分析、意味検索、言語翻訳などの NLP タスクでは、エンベディングが頻繁に使用されます。

Universal Sentence Encoder は、最も人気のあるオープンソース埋め込みモデルの 1 つであり、個々の文とテキスト チャンク全体を効率的にエンコードできます。

画像

画像埋め込みは、画像の視覚的特徴をベクトルとして取得して表現します。その使用例には、物体識別、画像分類、逆画像検索などがあります。 画像で検索.

画像の埋め込みを使用して、視覚的な検索機能を有効にすることもできます。データベース画像から埋め込みを抽出することにより、ユーザーはクエリ画像の埋め込みとデータベース写真の埋め込みを比較して、視覚的に類似した一致を見つけることができます。これは一般的に使用されます eコマース ユーザーが類似商品の写真をアップロードして商品を検索できるアプリ。

Google レンズは、カメラの写真を視覚的に類似した製品と比較する画像検索アプリケーションです。たとえば、スニーカーや衣類に似たインターネット商品を照合するために使用できます。

オーディオ

オーディオ エンベディングは、オーディオ信号のベクトル表現です。ベクトル埋め込みは聴覚特性をキャプチャし、システムが音声データをより効果的に解釈できるようにします。たとえば、オーディオ埋め込みは、音楽の推奨、ジャンル分類、オーディオの類似性検索、音声認識、話者検証に使用できます。

AI はさまざまなタイプの埋め込みに使用されていますが、音声 AI はテキスト AI や画像 AI に比べてあまり注目されていません。 Google Speech-to-Text と OpenAI Whisper は、コールセンター、医療技術、アクセシビリティ、音声テキスト変換アプリケーションなどの組織で使用される音声埋め込みアプリケーションです。

グラフ

グラフの埋め込みでは、ベクトルを使用してグラフ内のノードとエッジを表します。彼らは グラフ分析に関連するタスクで使用される リンク予測、コミュニティ認識、推奨システムなど。

各ノードは人、Web ページ、製品などのエンティティを表し、各エッジはそれらのエンティティ間に存在するリンクまたは接続を象徴します。これらのベクター埋め込みは、友人の推薦からあらゆることを実現できます。 ソーシャルネットワーク サイバーセキュリティの問題を検出します。

時系列データと3Dモデル

時系列エンベディングは、連続データ内の時間的パターンをキャプチャします。で使用されています モノのインターネット アプリケーション、財務データ、異常検出などのアクティビティ用のセンサー データ、 時系列予測 そしてパターンの識別。

3D オブジェクトの幾何学的側面は、3D モデルの埋め込みを使用してベクトルとして表現することもできます。これらは、3D 再構成、オブジェクト検出、フォーム マッチングなどのタスクに適用されます。

分子

分子埋め込みは、化合物をベクトルとして表します。これらは、創薬、化学的類似性検索、分子特性の予測に使用されます。これらの埋め込みは、分子の構造的および化学的特徴を捕捉するために、計算化学や医薬品開発でも使用されます。

Image showing vector embeddings of objects.
構造化された数値セットは、オブジェクトのベクトル埋め込みとして使用されます。

Word2Vec とは何ですか?

Word2Vec は、一般的な NLP 単語ベクトル埋め込みアプローチです。 Google によって作成された Word2Vec は、単語を連続ベクトル空間内の密なベクトルとして表現するように設計されています。文書内の単語のコンテキストを認識でき、テキストの分類、感情分析、分析などの NLP タスクで一般的に使用されます。 機械翻訳 機械が自然言語をより効果的に理解して処理できるようにするためです。

Word2Vec は、同様の意味を持つ単語は同様のベクトル表現を持つべきであるという原則に基づいており、モデルが単語間の意味論的なリンクをキャプチャできるようになります。

Word2Vec には XNUMX つの基本アーキテクチャがあります。 CBOW (Continuous Bag of Words) とスキップグラム:

  • CBOW。 このアーキテクチャは、文脈単語に基づいてターゲット単語を予測します。モデルにはコンテキストまたは周囲の単語が与えられ、中央のターゲット単語を予測するタスクが課されます。たとえば、「機敏な茶色のキツネが怠惰な犬を飛び越える」という文では、CBOW はコンテキストまたは周囲の単語を使用して予測します。 キツネ 対象の単語として。
  • スキップグラム。 CBOW とは異なり、Skip-Gram アーキテクチャはターゲット単語に基づいて文脈単語を予測します。モデルにはターゲット単語が与えられ、周囲の文脈用語を予測するように求められます。上記の「素早い茶色のキツネが怠惰な犬を飛び越える」の例文を取り上げると、skip-gram はターゲット単語を取得します。 キツネ 「The」、「quick」、「brown」、「jumps」、「over」、「the」、「lazy」、「dog」などの文脈上の単語を見つけます。

幅広い企業が生成 AI を採用し始めており、その破壊的な可能性が実証されています。診る 生成AIはどのように発展しているのか、将来どのような方向に進むのか、そして発生する可能性のある課題。

スポット画像

最新のインテリジェンス

スポット画像