Vier nieuwe Apache Cassandra 5.0-functies om enthousiast over te zijn - DATAVERSITY

Met de recente bètaversie van Apache Cassandra 5.0 is dit een goed moment voor teams om er een draai aan te geven en de meest interessante en verwachte nieuwe mogelijkheden van 5.0 te ontdekken.

Terwijl ik rondsnuffel met de nieuwe bèta, zijn hier vier functies geïntroduceerd met open-source Cassandra 5.0 waar ontwikkelaarsteams enthousiast over zouden moeten zijn:

1. Vectorondersteuning: introductie van Vector Search, nieuwe functies en een nieuw vectorgegevenstype

Cassandra 5.0 voegt toe Vector zoeken, een bijzonder krachtige nieuwe functie voor het vinden van relevante inhoud binnen grote datasets, samen met nieuwe CQL-functies en een nieuw vectorgegevenstype dat inbeddingsvectoren opslaat en ophaalt. Belangrijk voor velen is dat deze nieuwe functies Cassandra 5.0 tot een ideale datalaagtechnologie maken voor teams die AI/ML-projecten nastreven – en de specifieke functionaliteit bieden die deze projecten nodig hebben naast Cassandra's bestaande hoge beschikbaarheid, schaalbaarheid en open-sourcevoordelen.

Voor ML-modellen is het uitvoeren van gelijkenisvergelijkingen van cruciaal belang voor het begrijpen van gegevens en gegevensverbindingen in de context. Zo kunnen AI-toepassingen van productaanbevelingsmotoren tot generatieve AI chatbots werken door patronen te herkennen en besluitvorming te extrapoleren op basis van de gelijkenis van nieuwe gegevensinvoer en vragen met bestaande trainingsgegevens. Het kunnen opslaan van inbeddingsvectoren – arrays van drijvende-kommagetallen die communiceren hoe vergelijkbaar specifieke objecten of entiteiten met elkaar zijn – is de sleutel tot het mogelijk maken van die cruciale gelijkenisvergelijkingen. Daarom is Cassandra 5.0 nu een go-to-oplossing voor de ontwikkeling van AI-applicaties.

2. Op opslag aangesloten indexering

Cassandra 5.0's nieuwe Storage-Attached Indexing (SAI) optimaliseert de levenscyclus van secundaire indexen, terwijl ze ook efficiëntere winkels en gemakkelijker te gebruiken worden. Met SAI kunnen Cassandra-gebruikers een of meer secundaire indexen maken in een databasetabel, waarbij elke index is gebaseerd op een enkele kolom naar keuze van de gebruiker.

Deze zeer schaalbare, wereldwijd gedistribueerde indexering op kolomniveau biedt ongeëvenaarde I/O-doorvoer voor zoeken, inclusief Vector Search. SAI beschikt ook over modulaire uitbreidbaarheid, waarbij Vector Search als een eerste demonstratie van deze mogelijkheid dient. SAI-indexen kunnen semantiek vastleggen door zowel zoekopdrachten als inhoud (inclusief grote invoer zoals documenten en afbeeldingen) te indexeren om uitzonderlijke indexeringsfunctionaliteit te bereiken.

3. Trie Memtables en Trie-geïndexeerde SSTables

Cassandra 5.0-gebruikers kunnen profiteren van aanzienlijke potentiële prestatieverbeteringen en geheugenoptimalisatie die worden geleverd met de nieuwe op trie (prefix tree) gebaseerde Memtables en SSTables van deze versie. Hoewel Cassandra vooral bekend staat om zijn gedistribueerde architectuur, maken deze opslagformaten gebruik van pogingen en byte-vergelijkbare representaties van databasesleutels om de prestaties van Cassandra bij lees- en wijzigingsbewerkingen te verbeteren, en om structuren op de juiste manier aan te passen aan gegevens. Trie Memtables en Trie-Indexed SSTables verminderen ook de lasten van geheugenbeheeroverhead en garbagecollection, waardoor het voor grootschalige organisaties eenvoudiger wordt om hun gegevens te beheren.

Het komt erop neer: deze functies voor het verminderen van opslagoverhead – terwijl de schaalbaarheid en schrijf- en leesprestaties worden verbeterd – zullen de aandacht en waardering van Cassandra-gebruikers verdienen.

4. Nieuwe aggregatie- en wiskundige functies

Cassandra 5.0 voegt nieuwe native CQL-functies toe, en de mogelijkheid voor gebruikers om hun eigen nieuwe, door de gebruiker gedefinieerde functies te bouwen. Deze toevoegingen dienen om de snelheid en flexibiliteit waarmee gebruikers hun doelen met Cassandra kunnen bereiken, uit te breiden.

Nieuwe native aggregatiefuncties zijn onder meer:

tellen – Ontdek hoeveel items er in een verzameling zitten
max en min – Vind de maximale of minimale items van een collectie
som en gemiddelde – Vind de som of het gemiddelde van de items in een numerieke verzameling

Nieuwe native functies voor het werken met verzamelingskolommen zijn onder meer:

map_keys – Verkrijg de sleutels van een kaart
map_values – Haal de waarden van een kaart op

Nieuwe native wiskundige functies zijn onder meer:

abs – Geeft de absolute waarde van x terug
exp – Retourneert de waarde van e (de basis van natuurlijke logaritmen) tot de macht van de invoer
log – Retourneert de natuurlijke logaritme (basis e) van de invoer
log10 – Retourneert de logaritme met grondtal 10 van de invoer
round – Retourneert het gehele getal dat het dichtst bij de invoer ligt

Geef het een kans

Degenen die geïnteresseerd zijn in het benutten van de voordelen van Cassandra 5.0 die hier worden benadrukt, moeten het zelf uitproberen en een voorsprong nemen als het gaat om het benutten en optimaliseren van volledig open-source Cassandra.

Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
Bron: https://www.dataversity.net/four-new-apache-cassandra-5-0-features-to-be-excited-about/

Generatieve data-intelligentie

Vier nieuwe Apache Cassandra 5.0-functies om enthousiast over te zijn – DATAVERSITY

Geef het een kans

Drake bedreigd met rechtszaak over Tupac AI-zang

Exclusieve Trump Bitcoin NFT's met aangepaste rangtelwoorden voor kopers van 'Mugshot Edition' - CryptoInfoNet

Laatste intelligentie

Bedrijf biedt digitale financiële geletterdheidstraining voor Nigerianen - CryptoInfoNet

BDAG leidt de top 5 van veelbelovende crypto-voorverkoop van 2024

Hoe u het marktsentiment kunt beoordelen voordat u cryptocurrency koopt

BlockDAG's liquiditeits- en vestingperiode van $ 100 miljoen te midden van SOL-netwerkproblemen en DOT-prijsvoorspellingen

Rainbet- en Crypto-casino's: leiders van het peloton

Forbes noemt XRP, ADA, LTC, ETC onder de beste “zombie”-tokens