Zephyrnet-logo

Vier nieuwe Apache Cassandra 5.0-functies om enthousiast over te zijn – DATAVERSITY

Datum:

Met de recente bètaversie van Apache Cassandra 5.0 is dit een goed moment voor teams om er een draai aan te geven en de meest interessante en verwachte nieuwe mogelijkheden van 5.0 te ontdekken. 

Terwijl ik rondsnuffel met de nieuwe bèta, zijn hier vier functies geïntroduceerd met open-source Cassandra 5.0 waar ontwikkelaarsteams enthousiast over zouden moeten zijn:

1. Vectorondersteuning: introductie van Vector Search, nieuwe functies en een nieuw vectorgegevenstype

Cassandra 5.0 voegt toe Vector zoeken, een bijzonder krachtige nieuwe functie voor het vinden van relevante inhoud binnen grote datasets, samen met nieuwe CQL-functies en een nieuw vectorgegevenstype dat inbeddingsvectoren opslaat en ophaalt. Belangrijk voor velen is dat deze nieuwe functies Cassandra 5.0 tot een ideale datalaagtechnologie maken voor teams die AI/ML-projecten nastreven – en de specifieke functionaliteit bieden die deze projecten nodig hebben naast Cassandra's bestaande hoge beschikbaarheid, schaalbaarheid en open-sourcevoordelen. 

Voor ML-modellen is het uitvoeren van gelijkenisvergelijkingen van cruciaal belang voor het begrijpen van gegevens en gegevensverbindingen in de context. Zo kunnen AI-toepassingen van productaanbevelingsmotoren tot generatieve AI chatbots werken door patronen te herkennen en besluitvorming te extrapoleren op basis van de gelijkenis van nieuwe gegevensinvoer en vragen met bestaande trainingsgegevens. Het kunnen opslaan van inbeddingsvectoren – arrays van drijvende-kommagetallen die communiceren hoe vergelijkbaar specifieke objecten of entiteiten met elkaar zijn – is de sleutel tot het mogelijk maken van die cruciale gelijkenisvergelijkingen. Daarom is Cassandra 5.0 nu een go-to-oplossing voor de ontwikkeling van AI-applicaties.

2. Op opslag aangesloten indexering

Cassandra 5.0's nieuwe Storage-Attached Indexing (SAI) optimaliseert de levenscyclus van secundaire indexen, terwijl ze ook efficiëntere winkels en gemakkelijker te gebruiken worden. Met SAI kunnen Cassandra-gebruikers een of meer secundaire indexen maken in een databasetabel, waarbij elke index is gebaseerd op een enkele kolom naar keuze van de gebruiker.

Deze zeer schaalbare, wereldwijd gedistribueerde indexering op kolomniveau biedt ongeëvenaarde I/O-doorvoer voor zoeken, inclusief Vector Search. SAI beschikt ook over modulaire uitbreidbaarheid, waarbij Vector Search als een eerste demonstratie van deze mogelijkheid dient. SAI-indexen kunnen semantiek vastleggen door zowel zoekopdrachten als inhoud (inclusief grote invoer zoals documenten en afbeeldingen) te indexeren om uitzonderlijke indexeringsfunctionaliteit te bereiken.

3. Trie Memtables en Trie-geïndexeerde SSTables

Cassandra 5.0-gebruikers kunnen profiteren van aanzienlijke potentiële prestatieverbeteringen en geheugenoptimalisatie die worden geleverd met de nieuwe op trie (prefix tree) gebaseerde Memtables en SSTables van deze versie. Hoewel Cassandra vooral bekend staat om zijn gedistribueerde architectuur, maken deze opslagformaten gebruik van pogingen en byte-vergelijkbare representaties van databasesleutels om de prestaties van Cassandra bij lees- en wijzigingsbewerkingen te verbeteren, en om structuren op de juiste manier aan te passen aan gegevens. Trie Memtables en Trie-Indexed SSTables verminderen ook de lasten van geheugenbeheeroverhead en garbagecollection, waardoor het voor grootschalige organisaties eenvoudiger wordt om hun gegevens te beheren.

Het komt erop neer: deze functies voor het verminderen van opslagoverhead – terwijl de schaalbaarheid en schrijf- en leesprestaties worden verbeterd – zullen de aandacht en waardering van Cassandra-gebruikers verdienen. 

4. Nieuwe aggregatie- en wiskundige functies

Cassandra 5.0 voegt nieuwe native CQL-functies toe, en de mogelijkheid voor gebruikers om hun eigen nieuwe, door de gebruiker gedefinieerde functies te bouwen. Deze toevoegingen dienen om de snelheid en flexibiliteit waarmee gebruikers hun doelen met Cassandra kunnen bereiken, uit te breiden.

Nieuwe native aggregatiefuncties zijn onder meer:

  • tellen – Ontdek hoeveel items er in een verzameling zitten
  • max en min – Vind de maximale of minimale items van een collectie
  • som en gemiddelde – Vind de som of het gemiddelde van de items in een numerieke verzameling

Nieuwe native functies voor het werken met verzamelingskolommen zijn onder meer:

  • map_keys – Verkrijg de sleutels van een kaart
  • map_values ​​– Haal de waarden van een kaart op

Nieuwe native wiskundige functies zijn onder meer:

  • abs – Geeft de absolute waarde van x terug
  • exp – Retourneert de waarde van e (de basis van natuurlijke logaritmen) tot de macht van de invoer
  • log – Retourneert de natuurlijke logaritme (basis e) van de invoer
  • log10 – Retourneert de logaritme met grondtal 10 van de invoer
  • round – Retourneert het gehele getal dat het dichtst bij de invoer ligt

Geef het een kans

Degenen die geïnteresseerd zijn in het benutten van de voordelen van Cassandra 5.0 die hier worden benadrukt, moeten het zelf uitproberen en een voorsprong nemen als het gaat om het benutten en optimaliseren van volledig open-source Cassandra.

spot_img

Laatste intelligentie

spot_img