Apache Cassandra 5.0 の注目すべき XNUMX つの新機能 - DATAVERSITY

最近付きベータリリース Apache Cassandra 5.0 の導入に向けて、今がチームにとって、Apache Cassandra 5.0 を試して、XNUMX の最も興味深く期待される新機能を発見する絶好の機会です。

新しいベータ版をいろいろ調べてみたところ、オープンソース Cassandra 5.0 で導入された、開発者チームが注目すべき XNUMX つの機能を以下に挙げます。

1. ベクトルのサポート: ベクトル検索、新しい関数、新しいベクトルデータ型の導入

Cassandra 5.0 が追加ベクトル検索これは、大規模なデータセット内で関連するコンテンツを検索するための特に強力な新機能であり、新しい CQL 関数と、埋め込みベクトルを保存および取得する新しいベクトルデータタイプも含まれます。多くの人にとって重要なことは、これらの新機能により、Cassandra 5.0 が AI/ML プロジェクトを推進するチームにとって理想的なデータレイヤーテクノロジーとなり、Cassandra の既存の高可用性、スケーラビリティ、オープンソースの利点に加えて、プロジェクトに必要な特定の機能が提供されることです。

ML モデルの場合、コンテキスト内のデータとデータ接続を理解するには、類似性比較を実行することが重要です。たとえば、製品レコメンデーションエンジンから generative AI チャットボットは、パターンを認識し、新しいデータ入力とクエリと既存のトレーニングデータの類似性に基づいて意思決定を推定することによって動作します。エンベディングベクトル (特定のオブジェクトやエンティティが互いにどれだけ似ているかを伝える浮動小数点数の配列) を保存できることは、重要な類似性比較を可能にする鍵となります。したがって、Cassandra 5.0 は現在、AI アプリケーション開発の頼りになるソリューションです。

2. ストレージ接続インデックス作成

Cassandra 5.0 の新しい Storage-Attached Indexing (SAI) は、セカンダリインデックスのライフサイクルを最適化すると同時に、セカンダリインデックスのストアをより効率的にし、使いやすくします。 SAI を使用すると、Cassandra ユーザーは、データベーステーブルに XNUMX つ以上のセカンダリインデックスを作成できます。各インデックスは、ユーザーが選択した単一の列に基づいています。

この拡張性が高く、グローバルに分散された列レベルのインデックス作成により、ベクトル検索を含む検索に対して比類のない I/O スループットが提供されます。 SAI はモジュール式の拡張性も備えており、Vector Search はこの機能の最初のデモンストレーションとして機能します。 SAI インデックスは、クエリとコンテンツ (ドキュメントや画像などの大規模な入力を含む) の両方にインデックスを付けることでセマンティクスをキャプチャし、優れたインデックス作成機能を実現します。

3. Trie Memtable と Trie-Indexed SSTable

Cassandra 5.0 ユーザーは、このバージョンの新しいトライ (プレフィックスツリー) ベースの Memtable および SSTable に付属する大幅なパフォーマンスの向上とメモリの最適化を活用できます。 Cassandra は分散アーキテクチャで最もよく知られていますが、これらのストレージ形式は、データベースキーの試行とバイト比較可能な表現を利用して、読み取りおよび変更操作の Cassandra のパフォーマンスを向上させ、データに合わせて構造を正しくサイズ設定することもできます。 Trie Memtable と Trie-Indexed SSTable は、メモリ管理のオーバーヘッドとガベージコレクションの負担も軽減し、大規模な組織のデータ管理を容易にします。

結論としては、スケーラビリティと書き込みおよび読み取りのパフォーマンスを向上させながら、ストレージのオーバーヘッドを削減するこれらの機能は、Cassandra ユーザーの注目と評価を獲得することになります。

4. 新しい集計関数と数学関数

Cassandra 5.0 には、新しいネイティブ CQL 関数と、ユーザーが独自の新しいユーザー定義関数を構築する機能が追加されています。これらの追加により、ユーザーが Cassandra で目標を達成できる速度と柔軟性が向上します。

新しいネイティブ集計関数には次のものが含まれます。

count – コレクション内のアイテムの数を確認します。
max と min – コレクションの最大項目または最小項目を検索します。
sum と avg – 数値コレクション内の項目の合計または平均を求めます。

コレクション列を操作するための新しいネイティブ関数には次のものがあります。

map_keys – マップのキーを取得します
map_values – マップの値を取得します

新しいネイティブ数学関数には次のものが含まれます。

abs – x の絶対値を返します。
exp – e (自然対数の底) の値を入力の累乗で返します。
log – 入力の自然対数 (底 e) を返します。
log10 – 入力の底 10 の対数を返します。
round – 入力に最も近い整数を返します

試してごらん

ここで取り上げた Cassandra 5.0 の利点を活用することに興味がある人は、自分で試してみて、完全にオープンソースの Cassandra の利用と最適化に関して時代の先を行くべきです。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://www.dataversity.net/four-new-apache-cassandra-5-0-features-to-be-excited-about/

生成的データインテリジェンス

注目すべき Apache Cassandra 5.0 の XNUMX つの新機能 – DATAVERSITY

試してごらん

ホーム

ホームページ–クラウドファンディングスイート

最新のインテリジェンス

ビットコインが30日間のNFT売上高をリードし、ブロックチェーン競合他社24社を上回った

セキュリティよりも先行者利益を優先すると、Defiプロトコルはハッキングに対して脆弱になる – ニキータ・オブチニク

HKTDC がギフト、印刷、パッケージング、ライセンスイベントを発表

カーリー・ハンソン、アリス・イン・チェインズの「Nutshell」を心のこもったカバーで追悼

ヒュンダイは、EV需要の鈍化を補うためにさらに多くのハイブリッドを開発する – Autoblog

ドレイク、トゥパックのAIボーカルを巡る訴訟で脅迫される