Zephyrnet-logotyp

Fyra nya Apache Cassandra 5.0-funktioner att vara glada över – DATAVERSITET

Datum:

Med det senaste beta-release av Apache Cassandra 5.0, nu är det ett bra tillfälle för team att ge det en snurr och upptäcka 5.0:s mest intressanta och efterlängtade nya funktioner. 

När jag har letat runt med den nya betan, här är fyra funktioner introducerade med öppen källkod Cassandra 5.0 som utvecklarteam borde vara entusiastiska över:

1. Vektorstöd: Vi introducerar vektorsökning, nya funktioner och en ny vektordatatyp

Cassandra 5.0 lägger till Vektor Sök, en särskilt kraftfull ny funktion för att hitta relevant innehåll i stora datamängder, tillsammans med nya CQL-funktioner och en ny vektordatatyp som sparar och hämtar inbäddningsvektorer. Viktigt för många är att dessa nya funktioner gör Cassandra 5.0 till en idealisk datalagerteknik för team som driver AI/ML-projekt – vilket ger den specifika funktionalitet som dessa projekt kräver tillsammans med Cassandras befintliga höga tillgänglighet, skalbarhet och fördelar med öppen källkod. 

För ML-modeller är det avgörande att göra likhetsjämförelser för att förstå data och datakopplingar i sitt sammanhang. Till exempel AI-applikationer från produktrekommendationsmotorer till generativ AI chatbots fungerar genom att känna igen mönster och extrapolera beslutsfattande baserat på likheten mellan nya datainmatningar och frågor och befintliga träningsdata. Att kunna lagra inbäddningsvektorer – arrayer av flyttalstal som kommunicerar hur lika specifika objekt eller enheter är varandra – är nyckeln till att möjliggöra dessa avgörande likhetsjämförelser. Därför är Cassandra 5.0 nu en go-to-lösning för AI-applikationsutveckling.

2. Lagringsbifogad indexering

Cassandra 5.0:s nya Storage-Attached Indexing (SAI) optimerar livscykeln för sekundära index, samtidigt som de gör dem mer effektiva butiker och enklare att använda. SAI tillåter Cassandra-användare att skapa ett eller flera sekundära index på en databastabell, med varje index baserat på en enda kolumn som användaren väljer.

Denna mycket skalbara, globalt distribuerade indexering på kolumnnivå erbjuder oöverträffad I/O-genomströmning för sökning – inklusive Vector Search. SAI har också modulär utbyggbarhet, med Vector Search som en första demonstration av denna förmåga. SAI-index kan fånga semantik genom att indexera både frågor och innehåll (inklusive stora indata som dokument och bilder) för att uppnå exceptionell indexeringsfunktionalitet.

3. Prova Memtables och Trie-indexerade SSTables

Cassandra 5.0-användare kan dra nytta av betydande potentiella prestandaförbättringar och minnesoptimering som kommer med den här versionens nya trie (prefixträd)-baserade Memtables och SSTables. Även om Cassandra är mest känd för sin distribuerade arkitektur, använder dessa lagringsformat försök och byte-jämförbara representationer av databasnycklar för att förbättra Cassandras prestanda för läsningar och modifieringsoperationer, såväl som för korrekt storlek på strukturer till data. Prova memtables och Trie-indexerade SSTables minskar också bördan av minneshanteringskostnader och skräpinsamling, vilket gör det enklare för högskaliga organisationer att hantera sina data.

Summan av kardemumman: dessa funktioner för att minska lagringskostnader – samtidigt som de förbättrar skalbarhet och skriv- och läsprestanda – kommer att vinna Cassandra-användares uppmärksamhet och uppskattning. 

4. Nya aggregerings- och matematiska funktioner

Cassandra 5.0 lägger till nya inbyggda CQL-funktioner och möjligheten för användare att bygga sina egna nya användardefinierade funktioner. Dessa tillägg tjänar till att utöka hastigheten och flexibiliteten med vilken användare kan uppnå sina mål med Cassandra.

Nya inbyggda aggregeringsfunktioner inkluderar:

  • count – Hitta hur många föremål som finns i en samling
  • max och min – Hitta det högsta eller lägsta antalet objekt i en samling
  • summa och medelvärde – Hitta summan eller medelvärdet av objekten i en numerisk samling

Nya inbyggda funktioner för att arbeta på samlingskolumner inkluderar:

  • map_keys – Hämta nycklarna till en karta
  • map_values ​​– Hämta värdena för en karta

Nya inbyggda matematiska funktioner inkluderar:

  • abs – Returnerar det absoluta värdet av x
  • exp – Returnerar värdet av e (basen för naturliga logaritmer) till ingångens potens
  • log – Returnerar den naturliga logaritmen (bas e) för ingången
  • log10 – Returnerar bas 10-logaritmen för ingången
  • runda – Returnerar det närmaste heltal till indata

Ge det ett försök

De som är intresserade av att dra nytta av fördelarna med Cassandra 5.0 som lyfts fram här bör prova det själva och komma före när det gäller att använda och optimera Cassandra med helt öppen källkod.

plats_img

Senaste intelligens

plats_img