Reclassement 3 : Stimuler la recherche d'entreprise et les systèmes RAG

Introduction

Cohere a présenté son modèle de base de nouvelle génération, Rerank 3, pour une recherche d'entreprise efficace et Récupération Génération Augmentée(CHIFFON). Le modèle Rerank est compatible avec tout type de base de données ou index de recherche et peut également être intégré à toute application juridique dotée de capacités de recherche natives. Vous n'imaginez pas qu'une seule ligne de code puisse améliorer les performances de recherche ou réduire les frais d'exécution d'un Application RAG avec un impact négligeable sur la latence.

Explorons comment ce modèle de base est conçu pour faire progresser les systèmes de recherche et RAG d'entreprise, avec une précision et une efficacité accrues.

Capacités de reclassement

Rerank offre les meilleures fonctionnalités pour la recherche d'entreprise, notamment :

Longueur du contexte 4K qui améliore considérablement la qualité de recherche pour les documents plus longs.
Il peut rechercher des données multi-aspects et semi-structurées telles que des tableaux, du code, JSON documents, factures et e-mails.
Il peut couvrir plus de 100 langues.
Latence améliorée et coût total de possession (TCO) réduit

Modèles d'IA génératifs avec des contextes longs ont le potentiel d’exécuter un RAG. Afin d'améliorer le score de précision, la latence et le coût, la solution RAG doit nécessiter une combinaison de génération Modèles AI et bien sûr le modèle Rerank. Le reclassement sémantique de haute précision de rerank3 garantit que seules les informations pertinentes sont transmises au modèle de génération, ce qui augmente la précision des réponses et maintient la latence et le coût très faibles, en particulier lors de la récupération des informations à partir de millions de documents.

Recherche d'entreprise améliorée

Les données d'entreprise sont souvent très complexes et les systèmes actuels installés dans l'organisation rencontrent des difficultés pour rechercher dans des sources de données multi-aspects et semi-structurées. Surtout, dans l'organisation, les données les plus utiles ne se trouvent pas dans un format de document simple, tel que JSON, qui est très courant dans les applications d'entreprise. Rerank 3 est facilement capable de classer des e-mails complexes et multi-aspects, tels que les e-mails, en fonction de tous leurs champs de métadonnées pertinents, y compris leur récence.

Rerank 3 améliore considérablement la qualité de récupération du code. Cela peut augmenter la productivité des ingénieurs en les aidant à trouver plus rapidement les bons extraits de code, que ce soit dans la base de code de leur entreprise ou dans de vastes référentiels de documentation.

Reclasser 3 | Recherche d'entreprise améliorée — Précision de l'évaluation du code basée sur nDCG@10 sur Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS1000 (plus c'est élevé, mieux c'est).

Les géants de la technologie traitent également des sources de données multilingues et, auparavant, la récupération multilingue constituait le plus grand défi des méthodes basées sur des mots clés. Les modèles Rerank 3 offrent de solides performances multilingues avec plus de 100 langues simplifiant le processus de récupération pour les clients non anglophones.

L’optimisation du regroupement des données est un défi clé dans les systèmes de recherche sémantique et RAG. Rerank 3 résout ce problème avec une fenêtre contextuelle 4k, permettant le traitement direct de documents plus volumineux. Cela conduit à une meilleure prise en compte du contexte lors de la notation de pertinence.

Rerank 3 est également pris en charge dans l'API d'inférence d'Elastic. Elastic Search dispose d'une technologie de recherche largement adoptée et les capacités de recherche par mots clés et vectorielles de la plateforme Elasticsearch sont conçues pour gérer efficacement des données d'entreprise plus volumineuses et plus complexes.

« Nous sommes ravis de nous associer à Cohere pour aider les entreprises à libérer le potentiel de leurs données », a déclaré Matt Riley, GVP et GM d'Elasticsearch. Les modèles de récupération avancés de Cohere, Embed 3 et Rerank 3, offrent d'excellentes performances sur les données d'entreprise complexes et de grande taille. Ils sont la solution à vos problèmes, ils deviennent des composants essentiels dans tout système de recherche d'entreprise.

Latence améliorée avec un contexte plus long

Dans de nombreux domaines commerciaux tels que le commerce électronique ou le service client, une faible latence est cruciale pour offrir une expérience de qualité. Ils ont gardé cela à l'esprit lors de la création de Rerank 3, qui affiche une latence jusqu'à 2 fois inférieure à celle de Rerank 2 pour des documents plus courts et jusqu'à 3 fois des améliorations pour des contextes de longue durée.

Meilleures performances et RAG efficace

Dans les systèmes de récupération-génération augmentée (RAG), l’étape de récupération des documents est essentielle pour les performances globales. Rerank 3 aborde deux facteurs essentiels pour des performances RAG exceptionnelles : la qualité de la réponse et la latence. Le modèle excelle dans l'identification des documents les plus pertinents par rapport à la requête d'un utilisateur grâce à ses capacités de reclassement sémantique.

Ce processus de récupération ciblé améliore directement la précision des réponses du système RAG. En permettant une récupération efficace d'informations pertinentes à partir de grands ensembles de données, Rerank 3 permet aux grandes entreprises de libérer la valeur de leurs données propriétaires. Cela facilite diverses fonctions commerciales, notamment le support client, les services juridiques, les ressources humaines et les finances, en leur fournissant les informations les plus pertinentes pour répondre aux requêtes des utilisateurs.

Meilleures performances et RAG efficace — Rerank 3 est une solution rentable pour RAG lorsqu'elle est combinée avec la famille de modèles Command R. Il permet aux utilisateurs de transmettre moins de documents au LLM pour une génération fondée, tout en maintenant la précision et la latence. Cela rend RAG avec Rerank 80 à 93 % moins cher que les autres LLM génératifs.

L'intégration de Rerank 3 à la famille économique Command R pour les systèmes RAG offre une réduction significative du coût total de possession (TCO) pour les utilisateurs. Ceci est réalisé grâce à deux facteurs clés. Premièrement, Rerank 3 facilite la sélection de documents très pertinents, obligeant le LLM à traiter moins de documents pour générer une réponse fondée. Cela maintient la précision de la réponse tout en minimisant la latence. Deuxièmement, l'efficacité combinée des modèles Rerank 3 et Command R entraîne des réductions de coûts de 80 à 93 % par rapport aux LLM génératifs alternatifs du marché. En fait, si l’on considère les économies réalisées grâce à Rerank 3 et Command R, les réductions totales des coûts peuvent dépasser 98 %.

Une approche de plus en plus courante et bien connue pour les systèmes RAG consiste à utiliser les LLM comme reclasseurs pour le processus de récupération de documents. Rerank 3 surpasse les LLM leaders du secteur comme Claude -3 Sonte, GPT Turbo en termes de précision de classement tout en étant 90 à 98 % moins cher.

Rerank 3 améliore la précision et la qualité de la réponse LLM. Cela contribue également à réduire le coût total de possession de bout en bout. Rerank y parvient en éliminant nos documents les moins pertinents et en triant uniquement le petit sous-ensemble de ceux qui sont pertinents pour obtenir des réponses.

Conclusion

Rerank 3 est un outil révolutionnaire pour les systèmes de recherche d'entreprise et RAG. Il permet une grande précision dans la gestion de structures de données complexes et de plusieurs langues. Rerank 3 minimise le regroupement des données, réduisant ainsi la latence et le coût total de possession. Cela se traduit par des résultats de recherche plus rapides et des implémentations RAG rentables. Il s'intègre à Elasticsearch pour améliorer la prise de décision et l'expérience client.

Vous pouvez explorer de nombreux autres outils d'IA de ce type et leurs applications ici.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
La source: https://www.analyticsvidhya.com/blog/2024/04/rerank-3-boosting-enterprise-search-and-rag-systems/

Intelligence de données générative

Reclassement 3 : Stimuler la recherche d'entreprise et les systèmes RAG

Introduction

Capacités de reclassement

Recherche d'entreprise améliorée

Latence améliorée avec un contexte plus long

Meilleures performances et RAG efficace

Conclusion

Blog Nanonets sur l'automatisation intelligente et l'IA des processus métiers

VC Café

Dernières informations

VC Café

SES, basée à Paris, rachète Intelsat pour 3.1 milliards de dollars alors que les sociétés européennes de satellites se consolident – Tech Startups

La fin de la pollution plastique : comment les entreprises peuvent opérationnaliser la circularité | GreenBiz

La fin de la pollution plastique : comment les entreprises peuvent opérationnaliser la circularité | GreenBiz

La fin de la pollution plastique : comment les entreprises peuvent opérationnaliser la circularité | GreenBiz

La fin de la pollution plastique : comment les entreprises peuvent opérationnaliser la circularité | GreenBiz