ゼファーネットのロゴ

再ランク 3: エンタープライズ検索と RAG システムの強化

日付:

概要

Cohere は、効率的なエンタープライズ検索と 検索拡張生成(ラグ)。リランクモデルはあらゆる種類のと互換性があります データベース または検索インデックスを使用し、ネイティブ検索機能を備えたあらゆる法的アプリケーションに統合することもできます。たった 1 行のコードで検索パフォーマンスが向上したり、 RAGアプリケーション 遅延への影響は無視できます。  

この基盤モデルがエンタープライズ検索と RAG システムを向上させ、精度と効率を向上させるためにどのように設定されているかを見てみましょう。 

リランク3

リランクの機能 

Rerank は、次のようなエンタープライズ検索に最適な機能を提供します。 

  • 4K コンテキストの長さにより、長い形式のドキュメントの検索品質が大幅に向上します。 
  • テーブル、コード、 JSONの 書類、請求書、電子メール。 
  • 100 以上の言語をカバーできます。
  • 遅延の強化と総所有コスト (TCO) の削減

生成 AI モデル 長いコンテキストを使用すると、RAG が実行される可能性があります。精度スコア、レイテンシ、コストを向上させるために、RAG ソリューションには次の世代の組み合わせが必要です。 AIモデル そしてもちろんリランクモデル。 rerank3 の高精度のセマンティック再ランキングにより、特に数百万のドキュメントから情報を取得する場合に、関連する情報のみが生成モデルに供給されるため、応答の精度が向上し、待ち時間とコストが非常に低く抑えられます。 

企業データは多くの場合非常に複雑で、組織内に配置されている現在のシステムでは、マルチアスペクトおよび半構造化データ ソースを検索することが困難になります。主に、組織内で最も有用なデータは、エンタープライズ アプリケーション全体で非常に一般的な JSON などの単純なドキュメント形式ではありません。 Rerank 3 は、最新性を含む関連するメタデータ フィールドのすべてに基づいて、電子メールなどの複雑で複数の側面を簡単にランク付けできます。 

強化されたエンタープライズ検索
MIRACL の nDCG@10 に基づく多言語検索精度 (高いほど優れています)。

Rerank 3 により、コードの取得率が大幅に向上します。これにより、社内のコードベース内でも、膨大なドキュメント リポジトリ全体でも、適切なコード スニペットをより迅速に見つけられるようになり、エンジニアの生産性が向上します。

リランク 3 |強化されたエンタープライズ検索
Codesearchnet、Stackoverflow、CosQA、Human Eval、MBPP、DS10 の nDCG@1000 に基づくコード評価精度 (高いほど優れています)。

大手テクノロジー企業も多言語データ ソースを扱っており、以前はキーワード ベースの方法では多言語検索が最大の課題でした。 Rerank 3 モデルは、100 以上の言語に対応した強力な多言語パフォーマンスを提供し、英語を話さない顧客の検索プロセスを簡素化します。 

強化されたエンタープライズ検索
MIRACL の nDCG@10 に基づく多言語検索精度 (高いほど優れています)。

セマンティック検索と RAG システムにおける主な課題は、データ チャンクの最適化です。 Rerank 3 は 4K コンテキスト ウィンドウでこの問題に対処し、より大きなドキュメントの直接処理を可能にします。これにより、関連性スコアリング時のコンテキストの考慮が改善されます。

リランク 3 |強化されたエンタープライズ検索

Rerank 3 は Elastic の Inference API でもサポートされています。 Elastic Search には広く採用されている検索テクノロジがあり、Elasticsearch プラットフォームのキーワード検索機能とベクトル検索機能は、より大規模で複雑な企業データを効率的に処理できるように構築されています。 

Elasticsearch の GVP 兼 GM である Matt Riley は次のように述べています。 Cohereの高度な検索モデルであるEmbed 3およびRerank 3は、複雑で大規模な企業データに対して優れたパフォーマンスを提供します。これらは問題解決ツールであり、あらゆるエンタープライズ検索システムにおいて不可欠なコンポーネントになりつつあります。 

コンテキストが長くなったことでレイテンシーが改善

電子商取引やカスタマー サービスなどの多くのビジネス ドメインでは、高品質のエクスペリエンスを提供するために低遅延が不可欠です。彼らは Rerank 3 を構築する際にこれを念頭に置き、Rerank 2 と比較して、ドキュメントの長さが短い場合にレイテンシが最大 2 倍低くなり、コンテキストの長さが長い場合には最大 3 倍の改善が見られました。

リランク 3 |コンテキストが長くなったことでレイテンシーが改善
比較は、さまざまなドキュメントのトークン長プロファイルにわたって 50 個のドキュメントをランク付けする時間として計算されます。各実行では、各ドキュメント全体で均一なトークン長を持つ 50 個のドキュメントのバッチを想定しています。

パフォーマンスの向上と効率的な RAG

検索拡張生成 (RAG) システムでは、ドキュメントの検索段階が全体的なパフォーマンスにとって重要です。 Rerank 3 は、優れた RAG パフォーマンスを実現する XNUMX つの重要な要素、応答品質と遅延に対処します。このモデルは、セマンティックな再ランキング機能を通じて、ユーザーのクエリに最も関連性の高いドキュメントを正確に特定することに優れています。

この対象を絞った検索プロセスにより、RAG システムの応答の精度が直接向上します。 Rerank 3 は、大規模なデータセットから関連情報を効率的に取得できるようにすることで、大企業が独自のデータの価値を解放できるようにします。これにより、顧客サポート、法務、人事、財務などのさまざまなビジネス機能が、ユーザーの質問に対処するための最も関連性の高い情報を提供され、容易になります。

パフォーマンスの向上と効率的な RAG
Rerank 3 は、Command R ファミリのモデルと組み合わせることで、RAG にとってコスト効率の高いソリューションになります。これにより、ユーザーはグラウンド生成のために LLM に渡すドキュメントの数が減り、精度と遅延が維持されます。これにより、リランクを使用した RAG は他の生成 LLM よりも 80 ~ 93% 安価になります。

Rerank 3 を RAG システム用のコスト効率の高い Command R ファミリと統合することで、ユーザーの総所有コスト (TCO) が大幅に削減されます。これは 3 つの重要な要素によって達成されます。まず、Rerank 3 は関連性の高い文書の選択を容易にし、LLM が根拠のある応答を生成するために処理する文書の量を減らします。これにより、遅延を最小限に抑えながら応答精度が維持されます。第 80 に、Rerank 93 モデルと Command R モデルを組み合わせた効率により、市場の代替生成 LLM と比較して 3 ~ 98% のコスト削減につながります。実際、リランク XNUMX とコマンド R の両方によるコスト削減を考慮すると、合計コスト削減は XNUMX% を超える可能性があります。

リランク3
スタンドアロン コストは、それぞれ 1 個のトークンを含む 50 個のドキュメントと 250 個の出力トークンを含む 250M RAG プロンプトの推論コストに基づいています。 Rerank のコストは、1 つのドキュメント @ それぞれ 5 トークン、および 250 の出力トークンを含む 250M RAG プロンプトの推論コストに基づいています。

RAG システムの一般的かつよく知られるアプローチの 3 つは、ドキュメント検索プロセスのリランカーとして LLM を使用することです。 Rerank 3 は、Claude -90 Sonte、GPT Turbo などの業界をリードする LLM よりもランキング精度で優れており、価格も 98 ~ XNUMX% 低くなります。 

リランク3
TREC 10 データセットの nDCG@2020 に基づく精度 (高いほど優れています)。 LLM は、RankGPT で使用されるアプローチに従ってリスト形式で評価されます (Sun et al. 2023)。

リランク 3 により、LLM 応答の精度と品質が向上します。また、エンドツーエンドの TCO 削減にも役立ちます。 Rerank は、関連性の低い文書を取り除き、関連性の高い文書の小さなサブセットのみを分類して答えを導き出すことでこれを実現します。

まとめ

Rerank 3 は、エンタープライズ検索および RAG システム用の革新的なツールです。複雑なデータ構造や複数の言語を高精度で処理できるようになります。 Rerank 3 はデータのチャンク化を最小限に抑え、待ち時間と総所有コストを削減します。これにより、検索結果が高速化され、コスト効率の高い RAG 実装が実現します。 Elasticsearch と統合して、意思決定と顧客エクスペリエンスを向上させます。

さらに多くのこのような AI ツールとそのア​​プリケーションを探索できます こちら.

スポット画像

最新のインテリジェンス

スポット画像