Zephyrnet-Logo

Vier neue Funktionen von Apache Cassandra 5.0, die Sie begeistern werden – DATAVERSITY

Datum:

Mit der jüngsten Beta-Version von Apache Cassandra 5.0 ist jetzt ein guter Zeitpunkt für Teams, es auszuprobieren und die interessantesten und erwarteten neuen Funktionen von 5.0 zu entdecken. 

Während ich mich in der neuen Beta umgesehen habe, sind hier vier mit der Open-Source-Version Cassandra 5.0 eingeführte Funktionen, auf die sich Entwicklerteams freuen dürften:

1. Vektorunterstützung: Einführung der Vektorsuche, neuer Funktionen und eines neuen Vektordatentyps

Cassandra 5.0 fügt hinzu Vektorsuche, eine besonders leistungsstarke neue Funktion zum Auffinden relevanter Inhalte in großen Datensätzen, zusammen mit neuen CQL-Funktionen und einem neuen Vektordatentyp, der Einbettungsvektoren speichert und abruft. Für viele ist es wichtig, dass diese neuen Funktionen Cassandra 5.0 zu einer idealen Datenschichttechnologie für Teams machen, die KI-/ML-Projekte verfolgen. Sie bietet die spezifischen Funktionen, die diese Projekte benötigen, zusätzlich zu den bestehenden Hochverfügbarkeits-, Skalierbarkeits- und Open-Source-Vorteilen von Cassandra. 

Bei ML-Modellen ist die Durchführung von Ähnlichkeitsvergleichen entscheidend für das Verständnis von Daten und Datenverbindungen im Kontext. Zum Beispiel KI-Anwendungen von Produktempfehlungs-Engines bis hin zu generative KI Chatbots funktionieren, indem sie Muster erkennen und Entscheidungen basierend auf der Ähnlichkeit neuer Dateneingaben und Abfragen mit vorhandenen Trainingsdaten extrapolieren. Die Möglichkeit, Einbettungsvektoren zu speichern – Arrays aus Gleitkommazahlen, die mitteilen, wie ähnlich bestimmte Objekte oder Entitäten einander sind – ist der Schlüssel zum Ermöglichen dieser entscheidenden Ähnlichkeitsvergleiche. Daher ist Cassandra 5.0 jetzt eine Lösung der Wahl für die Entwicklung von KI-Anwendungen.

2. Storage-Attached-Indizierung

Das neue Storage-Attached Indexing (SAI) von Cassandra 5.0 optimiert den Lebenszyklus von Sekundärindizes und macht sie gleichzeitig effizienter und benutzerfreundlicher. Mit SAI können Cassandra-Benutzer einen oder mehrere sekundäre Indizes für eine Datenbanktabelle erstellen, wobei jeder Index auf einer einzelnen Spalte nach Wahl des Benutzers basiert.

Diese hoch skalierbare, global verteilte Indizierung auf Spaltenebene bietet einen unübertroffenen I/O-Durchsatz für die Suche – einschließlich der Vektorsuche. SAI bietet außerdem modulare Erweiterbarkeit, wobei Vector Search als erste Demonstration dieser Fähigkeit dient. SAI-Indizes können Semantik erfassen, indem sie sowohl Abfragen als auch Inhalte (einschließlich großer Eingaben wie Dokumente und Bilder) indizieren, um eine außergewöhnliche Indexierungsfunktionalität zu erreichen.

3. Trie-Memtables und Trie-indizierte SSTables

Benutzer von Cassandra 5.0 können erhebliche potenzielle Leistungsverbesserungen und Speicheroptimierungen nutzen, die mit den neuen Trie (Präfixbaum)-basierten Memtables und SSTables dieser Version einhergehen. Während Cassandra vor allem für seine verteilte Architektur bekannt ist, nutzen diese Speicherformate Versuche und bytevergleichbare Darstellungen von Datenbankschlüsseln, um die Leistung von Cassandra bei Lese- und Änderungsvorgängen sowie bei der korrekten Größenanpassung von Strukturen an Daten zu verbessern. Trie Memtables und Trie-Indexed SSTables reduzieren außerdem den Aufwand für die Speicherverwaltung und die Speicherbereinigung, wodurch es für große Unternehmen einfacher wird, ihre Daten zu verwalten.

Das Fazit: Diese Funktionen zur Reduzierung des Speicheraufwands – bei gleichzeitiger Verbesserung der Skalierbarkeit sowie der Schreib- und Leseleistung – werden die Aufmerksamkeit und Anerkennung der Cassandra-Benutzer gewinnen. 

4. Neue Aggregations- und Mathematikfunktionen

Cassandra 5.0 fügt neue native CQL-Funktionen hinzu und bietet Benutzern die Möglichkeit, ihre eigenen neuen benutzerdefinierten Funktionen zu erstellen. Diese Ergänzungen dienen dazu, die Geschwindigkeit und Flexibilität zu erhöhen, mit der Benutzer ihre Ziele mit Cassandra erreichen können.

Zu den neuen nativen Aggregationsfunktionen gehören:

  • count – Finden Sie heraus, wie viele Elemente sich in einer Sammlung befinden
  • max und min – Finden Sie die maximalen oder minimalen Elemente einer Sammlung
  • sum und avg – Finden Sie die Summe oder den Durchschnitt der Elemente in einer numerischen Sammlung

Zu den neuen nativen Funktionen für die Bearbeitung von Sammlungsspalten gehören:

  • map_keys – Holen Sie sich die Schlüssel einer Karte
  • map_values ​​– Ruft die Werte einer Karte ab

Zu den neuen nativen Mathematikfunktionen gehören:

  • abs – Gibt den absoluten Wert von x zurück
  • exp – Gibt den Wert von e (die Basis des natürlichen Logarithmus) hoch zur Eingabe zurück
  • log – Gibt den natürlichen Logarithmus (Basis e) der Eingabe zurück
  • log10 – Gibt den Logarithmus zur Basis 10 der Eingabe zurück
  • Round – Gibt die ganze Zahl zurück, die der Eingabe am nächsten kommt

Probieren Sie es aus

Wer die hier hervorgehobenen Vorteile von Cassandra 5.0 nutzen möchte, sollte es selbst ausprobieren und bei der Nutzung und Optimierung von vollständig Open-Source-Cassandra einen Schritt voraus sein.

spot_img

Neueste Intelligenz

spot_img