Logo Zéphyrnet

Reclassement 3 : Stimuler la recherche d'entreprise et les systèmes RAG

Date :

Introduction

Cohere a présenté son modèle de base de nouvelle génération, Rerank 3, pour une recherche d'entreprise efficace et Récupération Génération Augmentée(CHIFFON). Le modèle Rerank est compatible avec tout type de base de données ou index de recherche et peut également être intégré à toute application juridique dotée de capacités de recherche natives. Vous n'imaginez pas qu'une seule ligne de code puisse améliorer les performances de recherche ou réduire les frais d'exécution d'un Application RAG avec un impact négligeable sur la latence.  

Explorons comment ce modèle de base est conçu pour faire progresser les systèmes de recherche et RAG d'entreprise, avec une précision et une efficacité accrues. 

Reclasser 3

Capacités de reclassement 

Rerank offre les meilleures fonctionnalités pour la recherche d'entreprise, notamment : 

  • Longueur du contexte 4K qui améliore considérablement la qualité de recherche pour les documents plus longs. 
  • Il peut rechercher des données multi-aspects et semi-structurées telles que des tableaux, du code, JSON documents, factures et e-mails. 
  • Il peut couvrir plus de 100 langues.
  • Latence améliorée et coût total de possession (TCO) réduit

Modèles d'IA génératifs avec des contextes longs ont le potentiel d’exécuter un RAG. Afin d'améliorer le score de précision, la latence et le coût, la solution RAG doit nécessiter une combinaison de génération Modèles AI et bien sûr le modèle Rerank. Le reclassement sémantique de haute précision de rerank3 garantit que seules les informations pertinentes sont transmises au modèle de génération, ce qui augmente la précision des réponses et maintient la latence et le coût très faibles, en particulier lors de la récupération des informations à partir de millions de documents. 

Les données d'entreprise sont souvent très complexes et les systèmes actuels installés dans l'organisation rencontrent des difficultés pour rechercher dans des sources de données multi-aspects et semi-structurées. Surtout, dans l'organisation, les données les plus utiles ne se trouvent pas dans un format de document simple, tel que JSON, qui est très courant dans les applications d'entreprise. Rerank 3 est facilement capable de classer des e-mails complexes et multi-aspects, tels que les e-mails, en fonction de tous leurs champs de métadonnées pertinents, y compris leur récence. 

Recherche d'entreprise améliorée
Précision de récupération multilingue basée sur nDCG@10 sur MIRACL (plus c'est élevé, mieux c'est).

Rerank 3 améliore considérablement la qualité de récupération du code. Cela peut augmenter la productivité des ingénieurs en les aidant à trouver plus rapidement les bons extraits de code, que ce soit dans la base de code de leur entreprise ou dans de vastes référentiels de documentation.

Reclasser 3 | Recherche d'entreprise améliorée
Précision de l'évaluation du code basée sur nDCG@10 sur Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS1000 (plus c'est élevé, mieux c'est).

Les géants de la technologie traitent également des sources de données multilingues et, auparavant, la récupération multilingue constituait le plus grand défi des méthodes basées sur des mots clés. Les modèles Rerank 3 offrent de solides performances multilingues avec plus de 100 langues simplifiant le processus de récupération pour les clients non anglophones. 

Recherche d'entreprise améliorée
Précision de récupération multilingue basée sur nDCG@10 sur MIRACL (plus c'est élevé, mieux c'est).

L’optimisation du regroupement des données est un défi clé dans les systèmes de recherche sémantique et RAG. Rerank 3 résout ce problème avec une fenêtre contextuelle 4k, permettant le traitement direct de documents plus volumineux. Cela conduit à une meilleure prise en compte du contexte lors de la notation de pertinence.

Reclasser 3 | Recherche d'entreprise améliorée

Rerank 3 est également pris en charge dans l'API d'inférence d'Elastic. Elastic Search dispose d'une technologie de recherche largement adoptée et les capacités de recherche par mots clés et vectorielles de la plateforme Elasticsearch sont conçues pour gérer efficacement des données d'entreprise plus volumineuses et plus complexes. 

« Nous sommes ravis de nous associer à Cohere pour aider les entreprises à libérer le potentiel de leurs données », a déclaré Matt Riley, GVP et GM d'Elasticsearch. Les modèles de récupération avancés de Cohere, Embed 3 et Rerank 3, offrent d'excellentes performances sur les données d'entreprise complexes et de grande taille. Ils sont la solution à vos problèmes, ils deviennent des composants essentiels dans tout système de recherche d'entreprise. 

Latence améliorée avec un contexte plus long

Dans de nombreux domaines commerciaux tels que le commerce électronique ou le service client, une faible latence est cruciale pour offrir une expérience de qualité. Ils ont gardé cela à l'esprit lors de la création de Rerank 3, qui affiche une latence jusqu'à 2 fois inférieure à celle de Rerank 2 pour des documents plus courts et jusqu'à 3 fois des améliorations pour des contextes de longue durée.

Reclasser 3 | Latence améliorée avec un contexte plus long
Comparaisons calculées en fonction du temps nécessaire pour classer 50 documents sur une variété de profils de longueur de jeton de document ; chaque exécution suppose un lot de 50 documents avec une longueur de jeton uniforme sur chaque document.

Meilleures performances et RAG efficace

Dans les systèmes de récupération-génération augmentée (RAG), l’étape de récupération des documents est essentielle pour les performances globales. Rerank 3 aborde deux facteurs essentiels pour des performances RAG exceptionnelles : la qualité de la réponse et la latence. Le modèle excelle dans l'identification des documents les plus pertinents par rapport à la requête d'un utilisateur grâce à ses capacités de reclassement sémantique.

Ce processus de récupération ciblé améliore directement la précision des réponses du système RAG. En permettant une récupération efficace d'informations pertinentes à partir de grands ensembles de données, Rerank 3 permet aux grandes entreprises de libérer la valeur de leurs données propriétaires. Cela facilite diverses fonctions commerciales, notamment le support client, les services juridiques, les ressources humaines et les finances, en leur fournissant les informations les plus pertinentes pour répondre aux requêtes des utilisateurs.

Meilleures performances et RAG efficace
Rerank 3 est une solution rentable pour RAG lorsqu'elle est combinée avec la famille de modèles Command R. Il permet aux utilisateurs de transmettre moins de documents au LLM pour une génération fondée, tout en maintenant la précision et la latence. Cela rend RAG avec Rerank 80 à 93 % moins cher que les autres LLM génératifs.

L'intégration de Rerank 3 à la famille économique Command R pour les systèmes RAG offre une réduction significative du coût total de possession (TCO) pour les utilisateurs. Ceci est réalisé grâce à deux facteurs clés. Premièrement, Rerank 3 facilite la sélection de documents très pertinents, obligeant le LLM à traiter moins de documents pour générer une réponse fondée. Cela maintient la précision de la réponse tout en minimisant la latence. Deuxièmement, l'efficacité combinée des modèles Rerank 3 et Command R entraîne des réductions de coûts de 80 à 93 % par rapport aux LLM génératifs alternatifs du marché. En fait, si l’on considère les économies réalisées grâce à Rerank 3 et Command R, les réductions totales des coûts peuvent dépasser 98 %.

Reclasser 3
Le coût autonome est basé sur les coûts d'inférence pour 1 million d'invites RAG avec 50 documents contenant 250 jetons chacun et 250 jetons de sortie. Le coût avec Rerank est basé sur les coûts d'inférence pour 1 million d'invites RAG avec 5 documents à 250 jetons chacun et 250 jetons de sortie.

Une approche de plus en plus courante et bien connue pour les systèmes RAG consiste à utiliser les LLM comme reclasseurs pour le processus de récupération de documents. Rerank 3 surpasse les LLM leaders du secteur comme Claude -3 Sonte, GPT Turbo en termes de précision de classement tout en étant 90 à 98 % moins cher. 

Reclasser 3
Précision basée sur nDCG@10 sur l'ensemble de données TREC 2020 (plus c'est élevé, mieux c'est). Les LLM sont évalués par liste selon l'approche utilisée dans RankGPT (Sun et al. 2023).

Rerank 3 améliore la précision et la qualité de la réponse LLM. Cela contribue également à réduire le coût total de possession de bout en bout. Rerank y parvient en éliminant nos documents les moins pertinents et en triant uniquement le petit sous-ensemble de ceux qui sont pertinents pour obtenir des réponses.

Conclusion

Rerank 3 est un outil révolutionnaire pour les systèmes de recherche d'entreprise et RAG. Il permet une grande précision dans la gestion de structures de données complexes et de plusieurs langues. Rerank 3 minimise le regroupement des données, réduisant ainsi la latence et le coût total de possession. Cela se traduit par des résultats de recherche plus rapides et des implémentations RAG rentables. Il s'intègre à Elasticsearch pour améliorer la prise de décision et l'expérience client.

Vous pouvez explorer de nombreux autres outils d'IA de ce type et leurs applications ici.

spot_img

Dernières informations

spot_img