ゼファーネットのロゴ

注目すべき Apache Cassandra 5.0 の XNUMX つの新機能 – DATAVERSITY

日付:

最近付き ベータリリース Apache Cassandra 5.0 の導入に向けて、今がチームにとって、Apache Cassandra 5.0 を試して、XNUMX の最も興味深く期待される新機能を発見する絶好の機会です。 

新しいベータ版をいろいろ調べてみたところ、オープンソース Cassandra 5.0 で導入された、開発者チームが注目すべき XNUMX つの機能を以下に挙げます。

1. ベクトルのサポート: ベクトル検索、新しい関数、新しいベクトル データ型の導入

Cassandra 5.0 が追加 ベクトル検索これは、大規模なデータセット内で関連するコンテンツを検索するための特に強力な新機能であり、新しい CQL 関数と、埋め込みベクトルを保存および取得する新しいベクトル データ タイプも含まれます。多くの人にとって重要なことは、これらの新機能により、Cassandra 5.0 が AI/ML プロジェクトを推進するチームにとって理想的なデータレイヤー テクノロジーとなり、Cassandra の既存の高可用性、スケーラビリティ、オープンソースの利点に加えて、プロジェクトに必要な特定の機能が提供されることです。 

ML モデルの場合、コンテキスト内のデータとデータ接続を理解するには、類似性比較を実行することが重要です。たとえば、製品レコメンデーション エンジンから generative AI チャットボットは、パターンを認識し、新しいデータ入力とクエリと既存のトレーニング データの類似性に基づいて意思決定を推定することによって動作します。エンベディング ベクトル (特定のオブジェクトやエンティティが互いにどれだけ似ているかを伝える浮動小数点数の配列) を保存できることは、重要な類似性比較を可能にする鍵となります。したがって、Cassandra 5.0 は現在、AI アプリケーション開発の頼りになるソリューションです。

2. ストレージ接続インデックス作成

Cassandra 5.0 の新しい Storage-Attached Indexing (SAI) は、セカンダリ インデックスのライフサイクルを最適化すると同時に、セカンダリ インデックスのストアをより効率的にし、使いやすくします。 SAI を使用すると、Cassandra ユーザーは、データベース テーブルに XNUMX つ以上のセカンダリ インデックスを作成できます。各インデックスは、ユーザーが選択した単一の列に基づいています。

この拡張性が高く、グローバルに分散された列レベルのインデックス作成により、ベクトル検索を含む検索に対して比類のない I/O スループットが提供されます。 SAI はモジュール式の拡張性も備えており、Vector Search はこの機能の最初のデモンストレーションとして機能します。 SAI インデックスは、クエリとコンテンツ (ドキュメントや画像などの大規模な入力を含む) の両方にインデックスを付けることでセマンティクスをキャプチャし、優れたインデックス作成機能を実現します。

3. Trie Memtable と Trie-Indexed SSTable

Cassandra 5.0 ユーザーは、このバージョンの新しいトライ (プレフィックス ツリー) ベースの Memtable および SSTable に付属する大幅なパフォーマンスの向上とメモリの最適化を活用できます。 Cassandra は分散アーキテクチャで最もよく知られていますが、これらのストレージ形式は、データベース キーの試行とバイト比較可能な表現を利用して、読み取りおよび変更操作の Cassandra のパフォーマンスを向上させ、データに合わせて構造を正しくサイズ設定することもできます。 Trie Memtable と Trie-Indexed SSTable は、メモリ管理のオーバーヘッドとガベージ コレクションの負担も軽減し、大規模な組織のデータ管理を容易にします。

結論としては、スケーラビリティと書き込みおよび読み取りのパフォーマンスを向上させながら、ストレージのオーバーヘッドを削減するこれらの機能は、Cassandra ユーザーの注目と評価を獲得することになります。 

4. 新しい集計関数と数学関数

Cassandra 5.0 には、新しいネイティブ CQL 関数と、ユーザーが独自の新しいユーザー定義関数を構築する機能が追加されています。これらの追加により、ユーザーが Cassandra で目標を達成できる速度と柔軟性が向上します。

新しいネイティブ集計関数には次のものが含まれます。

  • count – コレクション内のアイテムの数を確認します。
  • max と min – コレクションの最大項目または最小項目を検索します。
  • sum と avg – 数値コレクション内の項目の合計または平均を求めます。

コレクション列を操作するための新しいネイティブ関数には次のものがあります。

  • map_keys – マップのキーを取得します
  • map_values – マップの値を取得します

新しいネイティブ数学関数には次のものが含まれます。

  • abs – x の絶対値を返します。
  • exp – e (自然対数の底) の値を入力の累乗で返します。
  • log – 入力の自然対数 (底 e) を返します。
  • log10 – 入力の底 10 の対数を返します。
  • round – 入力に最も近い整数を返します

試してごらん

ここで取り上げた Cassandra 5.0 の利点を活用することに興味がある人は、自分で試してみて、完全にオープンソースの Cassandra の利用と最適化に関して時代の先を行くべきです。

スポット画像

最新のインテリジェンス

スポット画像