Λογότυπο Zephyrnet

Rerank 3: Boosting Enterprise Search and RAG Systems

Ημερομηνία:

Εισαγωγή

Η Cohere παρουσίασε το μοντέλο βάσης επόμενης γενιάς, το Rerank 3 για αποτελεσματική αναζήτηση επιχειρήσεων και Ανάκτηση επαυξημένης γενιάς(ΚΟΥΡΕΛΙ). Το μοντέλο Rerank είναι συμβατό με κάθε είδους βάσεις δεδομένων ή ευρετήριο αναζήτησης και μπορεί επίσης να ενσωματωθεί σε οποιαδήποτε νομική εφαρμογή με δυνατότητες εγγενούς αναζήτησης. Δεν θα φανταστείτε ότι μια μόνο γραμμή κώδικα μπορεί να ενισχύσει την απόδοση αναζήτησης ή να μειώσει τη χρέωση για την εκτέλεση ενός Εφαρμογή RAG με αμελητέα επίδραση στην καθυστέρηση.  

Ας εξερευνήσουμε πώς αυτό το θεμελιώδες μοντέλο έχει ρυθμιστεί για να προάγει τα συστήματα εταιρικής αναζήτησης και RAG, με βελτιωμένη ακρίβεια και αποτελεσματικότητα. 

Επανακατάταξη 3

Δυνατότητες Rerank 

Το Rerank προσφέρει τις καλύτερες δυνατότητες για εταιρική αναζήτηση, οι οποίες περιλαμβάνουν τα ακόλουθα: 

  • Μήκος περιβάλλοντος 4K που βελτιώνει σημαντικά την ποιότητα αναζήτησης για έγγραφα μεγαλύτερης μορφής. 
  • Μπορεί να πραγματοποιήσει αναζήτηση σε δεδομένα πολλαπλών πτυχών και ημιδομημένων στοιχείων όπως πίνακες, κώδικας, JSON έγγραφα, τιμολόγια και email. 
  • Μπορεί να καλύψει περισσότερες από 100 γλώσσες.
  • Ενισχυμένη καθυστέρηση και μειωμένο συνολικό κόστος ιδιοκτησίας (TCO)

Δημιουργικά μοντέλα AI με μεγάλα πλαίσια έχουν τη δυνατότητα να εκτελέσουν ένα RAG. Προκειμένου να βελτιωθεί η βαθμολογία ακρίβειας, η καθυστέρηση και το κόστος, η λύση RAG πρέπει να απαιτεί συνδυασμό παραγωγής Μοντέλα AI και φυσικά το μοντέλο Rerank. Η σημασιολογική ανακατάταξη υψηλής ακρίβειας του rerank3 διασφαλίζει ότι μόνο οι σχετικές πληροφορίες τροφοδοτούνται στο μοντέλο παραγωγής, γεγονός που αυξάνει την ακρίβεια απόκρισης και διατηρεί την καθυστέρηση και το κόστος πολύ χαμηλά, ιδιαίτερα κατά την ανάκτηση των πληροφοριών από εκατομμύρια έγγραφα. 

Τα εταιρικά δεδομένα είναι συχνά πολύ περίπλοκα και τα τρέχοντα συστήματα που τοποθετούνται στον οργανισμό αντιμετωπίζουν δυσκολίες αναζήτησης μέσω πηγών δεδομένων πολλαπλών πτυχών και ημι-δομημένων. Κυρίως, στον οργανισμό τα πιο χρήσιμα δεδομένα δεν είναι στην απλή μορφή εγγράφου, όπως το JSON είναι πολύ κοινό σε εταιρικές εφαρμογές. Το Rerank 3 μπορεί εύκολα να ταξινομήσει σύνθετα, πολλαπλών πτυχών, όπως μηνύματα ηλεκτρονικού ταχυδρομείου με βάση όλα τα σχετικά πεδία μεταδεδομένων τους, συμπεριλαμβανομένης της πρόσφατης χρήσης τους. 

Βελτιωμένη αναζήτηση επιχειρήσεων
Πολυγλωσσική ακρίβεια ανάκτησης με βάση το nDCG@10 σε MIRACL (όσο υψηλότερη είναι καλύτερη).

Η ανακατάταξη 3 βελτιώνει σημαντικά το πόσο καλά ανακτά τον κώδικα. Αυτό μπορεί να ενισχύσει την παραγωγικότητα των μηχανικών, βοηθώντας τους να βρίσκουν τα σωστά αποσπάσματα κώδικα πιο γρήγορα, είτε εντός της βάσης κωδικών της εταιρείας τους είτε σε τεράστια αποθετήρια τεκμηρίωσης.

Επανακατάταξη 3 | Βελτιωμένη αναζήτηση επιχειρήσεων
Ακρίβεια αξιολόγησης κώδικα με βάση το nDCG@10 σε Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS1000 (όσο υψηλότερο είναι καλύτερο).

Οι τεχνολογικοί γίγαντες ασχολούνται επίσης με πολύγλωσσες πηγές δεδομένων και παλαιότερα η ανάκτηση πολλών γλωσσών ήταν η μεγαλύτερη πρόκληση με τις μεθόδους που βασίζονται σε λέξεις-κλειδιά. Τα μοντέλα Rerank 3 προσφέρουν ισχυρή πολυγλωσσική απόδοση με περισσότερες από 100+ γλώσσες που απλοποιούν τη διαδικασία ανάκτησης για μη αγγλόφωνους πελάτες. 

Βελτιωμένη αναζήτηση επιχειρήσεων
Πολυγλωσσική ακρίβεια ανάκτησης με βάση το nDCG@10 σε MIRACL (όσο υψηλότερη είναι καλύτερη).

Μια βασική πρόκληση στα συστήματα σημασιολογικής αναζήτησης και RAG είναι η βελτιστοποίηση τμηματοποίησης δεδομένων. Το Rerank 3 το αντιμετωπίζει με ένα παράθυρο περιβάλλοντος 4k, επιτρέποντας την άμεση επεξεργασία μεγαλύτερων εγγράφων. Αυτό οδηγεί σε βελτιωμένη εξέταση του πλαισίου κατά τη βαθμολόγηση συνάφειας.

Επανακατάταξη 3 | Βελτιωμένη αναζήτηση επιχειρήσεων

Το Rerank 3 υποστηρίζεται επίσης στο Elastic's Inference API. Η Elastic Search έχει μια ευρέως διαδεδομένη τεχνολογία αναζήτησης και οι δυνατότητες αναζήτησης λέξεων-κλειδιών και διανυσμάτων στην πλατφόρμα Elasticsearch έχουν σχεδιαστεί για να χειρίζονται αποτελεσματικά μεγαλύτερα και πιο σύνθετα εταιρικά δεδομένα. 

«Είμαστε ενθουσιασμένοι που συνεργαζόμαστε με την Cohere για να βοηθήσουμε τις επιχειρήσεις να ξεκλειδώσουν τις δυνατότητες των δεδομένων τους», δήλωσε ο Matt Riley, GVP και GM της Elasticsearch. Τα προηγμένα μοντέλα ανάκτησης της Cohere που είναι το Embed 3 και το Rerank 3 προσφέρουν εξαιρετική απόδοση σε πολύπλοκα και μεγάλα εταιρικά δεδομένα. Είναι ο επίλυσης προβλημάτων σας, αυτά γίνονται βασικά στοιχεία σε οποιοδήποτε σύστημα αναζήτησης επιχειρήσεων. 

Βελτιωμένη καθυστέρηση με μεγαλύτερο πλαίσιο

Σε πολλούς επιχειρηματικούς τομείς, όπως το ηλεκτρονικό εμπόριο ή η εξυπηρέτηση πελατών, η χαμηλή καθυστέρηση είναι ζωτικής σημασίας για την παροχή ποιοτικής εμπειρίας. Το κράτησαν αυτό υπόψη κατά τη δημιουργία του Rerank 3, το οποίο εμφανίζει έως και 2 φορές χαμηλότερο λανθάνοντα χρόνο σε σύγκριση με το Rerank 2 για μικρότερα μήκη εγγράφων και έως και 3x βελτιώσεις σε μεγάλα μήκη περιβάλλοντος.

Επανακατάταξη 3 | Βελτιωμένη καθυστέρηση με μεγαλύτερο πλαίσιο
Οι συγκρίσεις υπολογίστηκαν ως ο χρόνος για την κατάταξη 50 εγγράφων σε μια ποικιλία προφίλ μήκους εγγράφου. κάθε εκτέλεση προϋποθέτει μια παρτίδα 50 εγγράφων με ομοιόμορφο μήκος διακριτικού σε κάθε έγγραφο.

Καλύτερη απόδοση και αποτελεσματικό RAG

Στα συστήματα Retrieval-Augmented Generation (RAG), το στάδιο ανάκτησης εγγράφων είναι κρίσιμο για τη συνολική απόδοση. Το Rerank 3 αντιμετωπίζει δύο βασικούς παράγοντες για εξαιρετική απόδοση RAG: ποιότητα απόκρισης και καθυστέρηση. Το μοντέλο υπερέχει στον εντοπισμό των πιο συναφών εγγράφων στο ερώτημα ενός χρήστη μέσω των δυνατοτήτων σημασιολογικής ανακατάταξης του.

Αυτή η στοχευμένη διαδικασία ανάκτησης βελτιώνει άμεσα την ακρίβεια των αποκρίσεων του συστήματος RAG. Επιτρέποντας την αποτελεσματική ανάκτηση σχετικών πληροφοριών από μεγάλα σύνολα δεδομένων, η Rerank 3 εξουσιοδοτεί τις μεγάλες επιχειρήσεις να ξεκλειδώσουν την αξία των ιδιόκτητων δεδομένων τους. Αυτό διευκολύνει διάφορες επιχειρηματικές λειτουργίες, συμπεριλαμβανομένης της υποστήριξης πελατών, της νομικής, του ανθρώπινου δυναμικού και των οικονομικών, παρέχοντάς τους τις πιο σχετικές πληροφορίες για την αντιμετώπιση των ερωτημάτων των χρηστών.

Καλύτερη απόδοση και αποτελεσματικό RAG
Το Rerank 3 είναι μια οικονομικά αποδοτική λύση για το RAG όταν συνδυάζεται με την οικογένεια μοντέλων Command R. Επιτρέπει στους χρήστες να διαβιβάζουν λιγότερα έγγραφα στο LLM για γειωμένη παραγωγή, διατηρώντας την ακρίβεια και τον λανθάνοντα χρόνο. Αυτό καθιστά το RAG με Rerank 80-93% λιγότερο ακριβό από άλλα γενετικά LLM.

Η ενσωμάτωση του Rerank 3 με την οικονομικά αποδοτική οικογένεια Command R για συστήματα RAG προσφέρει σημαντική μείωση στο συνολικό κόστος ιδιοκτησίας (TCO) για τους χρήστες. Αυτό επιτυγχάνεται μέσω δύο βασικών παραγόντων. Πρώτον, η Rerank 3 διευκολύνει την εξαιρετικά σχετική επιλογή εγγράφων, απαιτώντας από το LLM να επεξεργάζεται λιγότερα έγγραφα για τη δημιουργία γειωμένης απόκρισης. Αυτό διατηρεί την ακρίβεια απόκρισης ενώ ελαχιστοποιεί την καθυστέρηση. Δεύτερον, η συνδυασμένη αποτελεσματικότητα των μοντέλων Rerank 3 και Command R οδηγεί σε μειώσεις κόστους κατά 80-93% σε σύγκριση με τα εναλλακτικά LLMs της αγοράς. Στην πραγματικότητα, λαμβάνοντας υπόψη την εξοικονόμηση κόστους τόσο από το Rerank 3 όσο και από το Command R, οι συνολικές μειώσεις κόστους μπορεί να ξεπεράσουν το 98%.

Επανακατάταξη 3
Το αυτόνομο κόστος βασίζεται στο κόστος συμπερασμάτων για προτροπές RAG 1M με 50 έγγραφα που περιέχουν 250 διακριτικά το καθένα και 250 μάρκες εξόδου. Το Cost with Rerank βασίζεται στο κόστος συμπερασμάτων για 1M προτροπές RAG με 5 έγγραφα @ 250 tokens το καθένα και 250 tokens εξόδου.

Μια ολοένα και πιο κοινή και γνωστή προσέγγιση για συστήματα RAG είναι η χρήση LLM ως ανακατατάξεων για τη διαδικασία ανάκτησης εγγράφων. Το Rerank 3 ξεπερνά τα κορυφαία LLM του κλάδου, όπως ο Claude -3 Sonte, το GPT Turbo στην ακρίβεια κατάταξης, ενώ είναι 90-98% λιγότερο ακριβό. 

Επανακατάταξη 3
Ακρίβεια με βάση το nDCG@10 στο σύνολο δεδομένων TREC 2020 (όσο υψηλότερο τόσο καλύτερο). Τα LLMs αξιολογούνται με τρόπο καταλόγου ακολουθώντας την προσέγγιση που χρησιμοποιείται στο RankGPT (Sun et al. 2023).

Το Rerank 3 ενισχύει την ακρίβεια και την ποιότητα της απόκρισης LLM. Βοηθά επίσης στη μείωση του TCO από άκρο σε άκρο. Το Rerank το επιτυγχάνει αυτό αφαιρώντας τα λιγότερο σχετικά έγγραφά μας και ταξινομώντας μόνο το μικρό υποσύνολο σχετικών για να αντλήσει απαντήσεις.

Συμπέρασμα

Το Rerank 3 είναι ένα επαναστατικό εργαλείο για εταιρική αναζήτηση και συστήματα RAG. Επιτρέπει υψηλή ακρίβεια στο χειρισμό πολύπλοκων δομών δεδομένων και πολλαπλών γλωσσών. Η ανακατάταξη 3 ελαχιστοποιεί το τεμαχισμό δεδομένων, μειώνοντας τον λανθάνοντα χρόνο και το συνολικό κόστος ιδιοκτησίας. Αυτό έχει ως αποτέλεσμα ταχύτερα αποτελέσματα αναζήτησης και οικονομικά αποδοτικές εφαρμογές RAG. Ενσωματώνεται με το Elasticsearch για βελτιωμένη λήψη αποφάσεων και εμπειρίες πελατών.

Μπορείτε να εξερευνήσετε πολλά περισσότερα τέτοια εργαλεία τεχνητής νοημοσύνης και τις εφαρμογές τους εδώ.

spot_img

Τελευταία Νοημοσύνη

spot_img