Λογότυπο Zephyrnet

Τέσσερις νέες δυνατότητες του Apache Cassandra 5.0 που θα σας ενθουσιάσουν – DATAVERSITY

Ημερομηνία:

Με την πρόσφατη έκδοση beta του Apache Cassandra 5.0, τώρα είναι η κατάλληλη στιγμή για τις ομάδες να το δουν και να ανακαλύψουν τις πιο ενδιαφέρουσες και αναμενόμενες νέες δυνατότητες του 5.0. 

Καθώς έχω ασχοληθεί με τη νέα beta, ακολουθούν τέσσερα χαρακτηριστικά που εισήχθησαν με την Cassandra 5.0 ανοιχτού κώδικα για τα οποία οι ομάδες προγραμματιστών θα πρέπει να ενθουσιαστούν:

1. Υποστήριξη διανυσμάτων: Εισαγωγή διανυσματικής αναζήτησης, νέων συναρτήσεων και νέου τύπου διανυσματικών δεδομένων

Προσθέτει το Cassandra 5.0 Διανυσματική αναζήτηση, μια ιδιαίτερα ισχυρή νέα δυνατότητα για την εύρεση σχετικού περιεχομένου σε μεγάλα σύνολα δεδομένων, μαζί με νέες συναρτήσεις CQL και έναν νέο διανυσματικό τύπο δεδομένων που αποθηκεύει και ανακτά διανύσματα ενσωματώσεων. Είναι σημαντικό για πολλούς, αυτές οι νέες δυνατότητες καθιστούν το Cassandra 5.0 ιδανική τεχνολογία επιπέδου δεδομένων για ομάδες που επιδιώκουν έργα AI/ML – παρέχοντας τη συγκεκριμένη λειτουργικότητα που απαιτούν αυτά τα έργα παράλληλα με τα υπάρχοντα οφέλη υψηλής διαθεσιμότητας, επεκτασιμότητας και ανοιχτού κώδικα της Cassandra. 

Για τα μοντέλα ML, η εκτέλεση συγκρίσεων ομοιότητας είναι κρίσιμη για την κατανόηση δεδομένων και συνδέσεων δεδομένων στο πλαίσιο. Για παράδειγμα, εφαρμογές AI από κινητήρες συστάσεων προϊόντων έως γενετική AI Τα chatbots λειτουργούν αναγνωρίζοντας μοτίβα και προεκτείνοντας τη λήψη αποφάσεων με βάση την ομοιότητα των νέων εισροών δεδομένων και των ερωτημάτων με τα υπάρχοντα δεδομένα εκπαίδευσης. Η δυνατότητα αποθήκευσης διανυσμάτων ενσωματώσεων - συστοιχιών αριθμών κινητής υποδιαστολής που επικοινωνούν πόσο παρόμοια είναι τα συγκεκριμένα αντικείμενα ή οντότητες μεταξύ τους - είναι το κλειδί για να ενεργοποιηθούν αυτές οι κρίσιμες συγκρίσεις ομοιότητας. Ως εκ τούτου, η Cassandra 5.0 είναι πλέον μια λύση για την ανάπτυξη εφαρμογών AI.

2. Ευρετηρίαση με επισύναψη αποθήκευσης

Η νέα ευρετηρίαση με προσαρτημένο χώρο αποθήκευσης (SAI) της Cassandra 5.0 βελτιστοποιεί τον κύκλο ζωής των δευτερευόντων ευρετηρίων, ενώ τα καθιστά επίσης πιο αποτελεσματικά και ευκολότερα στη χρήση τους. Το SAI επιτρέπει στους χρήστες της Cassandra να δημιουργούν ένα ή περισσότερα δευτερεύοντα ευρετήρια σε έναν πίνακα βάσης δεδομένων, με κάθε ευρετήριο να βασίζεται σε μία στήλη της επιλογής του χρήστη.

Αυτή η εξαιρετικά επεκτάσιμη, παγκοσμίως κατανεμημένη ευρετηρίαση σε επίπεδο στήλης προσφέρει απαράμιλλη ροή εισόδου/εξόδου για αναζήτηση – συμπεριλαμβανομένης της διανυσματικής αναζήτησης. Το SAI διαθέτει επίσης αρθρωτή επεκτασιμότητα, με την Αναζήτηση Vector να χρησιμεύει ως αρχική επίδειξη αυτής της ικανότητας. Τα ευρετήρια SAI μπορούν να συλλάβουν τη σημασιολογία ευρετηριάζοντας τόσο τα ερωτήματα όσο και το περιεχόμενο (συμπεριλαμβανομένων μεγάλων εισόδων όπως έγγραφα και εικόνες) για την επίτευξη εξαιρετικής λειτουργικότητας ευρετηρίασης.

3. Trie Memtables και Trie-Indexed SSTables

Οι χρήστες του Cassandra 5.0 μπορούν να αξιοποιήσουν σημαντικές πιθανές βελτιώσεις απόδοσης και βελτιστοποίηση μνήμης που συνοδεύουν τα νέα Memtables και SSTables που βασίζονται σε δοκιμασία (δέντρο προθέματος) αυτής της έκδοσης. Ενώ η Cassandra είναι περισσότερο γνωστή για την κατανεμημένη αρχιτεκτονική της, αυτές οι μορφές αποθήκευσης χρησιμοποιούν δοκιμασίες και συγκρίσιμες με byte αναπαραστάσεις κλειδιών βάσης δεδομένων για να βελτιώσουν την απόδοση της Cassandra για λειτουργίες ανάγνωσης και τροποποίησης, καθώς και για το σωστό μέγεθος δομών σε δεδομένα. Τα Trie Memtables και τα Trie-Indexed SSTables μειώνουν επίσης τις επιβαρύνσεις της διαχείρισης μνήμης και της συλλογής σκουπιδιών, καθιστώντας ευκολότερο για τους οργανισμούς υψηλής κλίμακας τη διαχείριση των δεδομένων τους.

Το συμπέρασμα: αυτές οι δυνατότητες για τη μείωση των επιβαρύνσεων αποθήκευσης – βελτιώνοντας παράλληλα την επεκτασιμότητα και την απόδοση εγγραφής και ανάγνωσης – θα κερδίσουν την προσοχή και την εκτίμηση των χρηστών Cassandra. 

4. Νέα συγκέντρωση και μαθηματικές συναρτήσεις

Η Cassandra 5.0 προσθέτει νέες εγγενείς λειτουργίες CQL και τη δυνατότητα στους χρήστες να δημιουργούν τις δικές τους νέες λειτουργίες που καθορίζονται από το χρήστη. Αυτές οι προσθήκες χρησιμεύουν για την επέκταση της ταχύτητας και της ευελιξίας με την οποία οι χρήστες μπορούν να επιτύχουν τους στόχους τους με την Cassandra.

Οι νέες εγγενείς συναρτήσεις συγκέντρωσης περιλαμβάνουν:

  • count – Βρείτε πόσα αντικείμενα υπάρχουν σε μια συλλογή
  • max και min – Βρείτε τα μέγιστα ή τα ελάχιστα στοιχεία μιας συλλογής
  • άθροισμα και μέσος όρος – Βρείτε το άθροισμα ή τον μέσο όρο των στοιχείων σε μια αριθμητική συλλογή

Οι νέες εγγενείς συναρτήσεις για λειτουργία σε στήλες συλλογής περιλαμβάνουν:

  • map_keys – Λάβετε τα κλειδιά ενός χάρτη
  • map_values ​​– Λάβετε τις τιμές ενός χάρτη

Οι νέες εγγενείς μαθηματικές συναρτήσεις περιλαμβάνουν:

  • abs – Επιστρέφει την απόλυτη τιμή του x
  • exp – Επιστρέφει την τιμή του e (η βάση των φυσικών λογαρίθμων) στην ισχύ της εισόδου
  • log – Επιστρέφει τον φυσικό λογάριθμο (βάση e) της εισόδου
  • log10 – Επιστρέφει τον λογάριθμο βάσης 10 της εισόδου
  • round – Επιστρέφει τον πλησιέστερο ακέραιο στην είσοδο

Δώσε το να πάει

Όσοι ενδιαφέρονται να εκμεταλλευτούν τα πλεονεκτήματα του Cassandra 5.0 που επισημαίνονται εδώ θα πρέπει να το δοκιμάσουν μόνοι τους και να ξεπεράσουν την καμπύλη όσον αφορά τη χρήση και τη βελτιστοποίηση της Cassandra πλήρως ανοιχτού κώδικα.

spot_img

Τελευταία Νοημοσύνη

spot_img