Logotipo de Zephyrnet

Reclasificación 3: Impulsar la búsqueda empresarial y los sistemas RAG

Fecha:

Introducción

Cohere presentó su modelo básico de próxima generación, Rerank 3 para una búsqueda empresarial eficiente y Recuperación Generación Aumentada(TRAPO). El modelo Rerank es compatible con cualquier tipo de base de datos o índice de búsqueda y también se puede integrar en cualquier aplicación legal con capacidades de búsqueda nativas. No imaginará que una sola línea de código puede aumentar el rendimiento de la búsqueda o reducir la carga de ejecutar un aplicación de trapo con un impacto insignificante en la latencia.  

Exploremos cómo se establece este modelo básico para hacer avanzar los sistemas RAG y de búsqueda empresarial, con mayor precisión y eficiencia. 

Reclasificar 3

Capacidades de reclasificación 

Rerank ofrece las mejores capacidades para la búsqueda empresarial que incluyen lo siguiente: 

  • Longitud de contexto de 4K que mejora significativamente la calidad de búsqueda de documentos de formato más largo. 
  • Puede buscar datos semiestructurados y de múltiples aspectos como tablas, códigos, JSON documentos, facturas y correos electrónicos. 
  • Puede cubrir más de 100 idiomas.
  • Latencia mejorada y menor costo total de propiedad (TCO)

Modelos de IA generativa con contextos largos tienen el potencial de ejecutar un RAG. Para mejorar la puntuación de precisión, la latencia y el costo, la solución RAG debe requerir una combinación de generación Modelos AI y por supuesto el modelo Rerank. La reclasificación semántica de alta precisión de rerank3 garantiza que solo se introduzca la información relevante en el modelo de generación, lo que aumenta la precisión de la respuesta y mantiene la latencia y el costo muy bajos, en particular cuando se recupera información de millones de documentos. 

Los datos empresariales suelen ser muy complejos y los sistemas actuales que se colocan en la organización encuentran dificultades para buscar en fuentes de datos semiestructurados y de múltiples aspectos. Principalmente, en la organización los datos más útiles no están en el formato de documento simple, como JSON, que es muy común en las aplicaciones empresariales. Rerank 3 puede clasificar fácilmente mensajes complejos y de múltiples aspectos, como correos electrónicos, en función de todos sus campos de metadatos relevantes, incluida su actualidad. 

Búsqueda empresarial mejorada
Precisión de recuperación multilingüe basada en nDCG@10 en MIRACL (cuanto más alto, mejor).

Rerank 3 mejora significativamente la calidad de recuperación del código. Esto puede aumentar la productividad de los ingenieros al ayudarlos a encontrar los fragmentos de código correctos más rápido, ya sea dentro de la base de código de su empresa o en vastos repositorios de documentación.

Reclasificar 3 | Búsqueda empresarial mejorada
Precisión de la evaluación del código basada en nDCG@10 en Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS1000 (cuanto más alto, mejor).

Los gigantes tecnológicos también se ocupan de fuentes de datos multilingües y, anteriormente, la recuperación multilingüe ha sido el mayor desafío con los métodos basados ​​en palabras clave. Los modelos Rerank 3 ofrecen un sólido rendimiento multilingüe con más de 100 idiomas, lo que simplifica el proceso de recuperación para los clientes que no hablan inglés. 

Búsqueda empresarial mejorada
Precisión de recuperación multilingüe basada en nDCG@10 en MIRACL (cuanto más alto, mejor).

Un desafío clave en la búsqueda semántica y los sistemas RAG es la optimización de la fragmentación de datos. Rerank 3 soluciona esto con una ventana contextual de 4k, lo que permite el procesamiento directo de documentos más grandes. Esto conduce a una mejor consideración del contexto durante la puntuación de relevancia.

Reclasificar 3 | Búsqueda empresarial mejorada

Rerank 3 también es compatible con la API de inferencia de Elastic. Elastic Search tiene una tecnología de búsqueda ampliamente adoptada y las capacidades de búsqueda de palabras clave y vectores en la plataforma Elasticsearch están diseñadas para manejar datos empresariales más grandes y complejos de manera eficiente. 

"Estamos entusiasmados de asociarnos con Cohere para ayudar a las empresas a desbloquear el potencial de sus datos", dijo Matt Riley, GVP y GM de Elasticsearch. Los modelos de recuperación avanzados de Cohere, Embed 3 y Rerank 3, ofrecen un rendimiento excelente en datos empresariales grandes y complejos. Son su solucionador de problemas y se están convirtiendo en componentes esenciales en cualquier sistema de búsqueda empresarial. 

Latencia mejorada con contexto más largo

En muchos ámbitos empresariales, como el comercio electrónico o el servicio de atención al cliente, una baja latencia es crucial para ofrecer una experiencia de calidad. Tuvieron esto en cuenta al crear Rerank 3, que muestra una latencia hasta 2 veces menor en comparación con Rerank 2 para documentos de menor longitud y mejoras de hasta 3 veces en longitudes de contexto largas.

Reclasificar 3 | Latencia mejorada con contexto más largo
Las comparaciones se calcularon como el tiempo para clasificar 50 documentos en una variedad de perfiles de longitud de token de documentos; cada ejecución supone un lote de 50 documentos con una longitud de token uniforme en cada documento.

Mejor rendimiento y RAG eficiente

En los sistemas de recuperación de generación aumentada (RAG), la etapa de recuperación de documentos es fundamental para el rendimiento general. Rerank 3 aborda dos factores esenciales para un rendimiento excepcional de RAG: calidad de respuesta y latencia. El modelo destaca por identificar los documentos más relevantes para la consulta de un usuario a través de sus capacidades de reclasificación semántica.

Este proceso de recuperación dirigido mejora directamente la precisión de las respuestas del sistema RAG. Al permitir la recuperación eficiente de información pertinente de grandes conjuntos de datos, Rerank 3 permite a las grandes empresas desbloquear el valor de sus datos patentados. Esto facilita diversas funciones comerciales, incluida la atención al cliente, legal, recursos humanos y finanzas, brindándoles la información más relevante para abordar las consultas de los usuarios.

Mejor rendimiento y RAG eficiente
Rerank 3 es una solución rentable para RAG cuando se combina con la familia de modelos Command R. Permite a los usuarios pasar menos documentos al LLM para una generación basada en tierra, manteniendo la precisión y la latencia. Esto hace que RAG con Rerank sea entre un 80% y un 93% menos costoso que otros LLM generativos.

La integración de Rerank 3 con la rentable familia Command R para sistemas RAG ofrece una reducción significativa en el costo total de propiedad (TCO) para los usuarios. Esto se logra a través de dos factores clave. En primer lugar, Rerank 3 facilita la selección de documentos muy relevantes, lo que requiere que el LLM procese menos documentos para generar una respuesta fundamentada. Esto mantiene la precisión de la respuesta y minimiza la latencia. En segundo lugar, la eficiencia combinada de los modelos Rerank 3 y Command R conduce a reducciones de costos del 80-93 % en comparación con los LLM generativos alternativos del mercado. De hecho, al considerar los ahorros de costos de Rerank 3 y Command R, las reducciones de costos totales pueden superar el 98 %.

Reclasificar 3
El costo independiente se basa en los costos de inferencia para 1 millón de mensajes RAG con 50 documentos que contienen 250 tokens cada uno y 250 tokens de salida. El costo con Rerank se basa en los costos de inferencia para 1 millón de mensajes RAG con 5 documentos con 250 tokens cada uno y 250 tokens de salida.

Un enfoque cada vez más común y conocido para los sistemas RAG es utilizar LLM como reordenadores para el proceso de recuperación de documentos. Rerank 3 supera a los LLM líderes en la industria como Claude -3 Sonte, GPT Turbo en cuanto a precisión de clasificación y es entre un 90 y un 98 % menos costoso. 

Reclasificar 3
Precisión basada en nDCG@10 en el conjunto de datos TREC 2020 (cuanto más alto, mejor). Los LLM se evalúan en forma de listas siguiendo el enfoque utilizado en RankGPT (Sun et al. 2023).

El cambio de rango 3 aumenta la precisión y la calidad de la respuesta del LLM. También ayuda a reducir el TCO de un extremo a otro. Rerank logra esto eliminando nuestros documentos menos relevantes y clasificando solo el pequeño subconjunto de los relevantes para obtener respuestas.

Conclusión

Rerank 3 es una herramienta revolucionaria para la búsqueda empresarial y los sistemas RAG. Permite una alta precisión en el manejo de estructuras de datos complejas y múltiples idiomas. Rerank 3 minimiza la fragmentación de datos, lo que reduce la latencia y el costo total de propiedad. Esto da como resultado resultados de búsqueda más rápidos e implementaciones RAG rentables. Se integra con Elasticsearch para mejorar la toma de decisiones y la experiencia del cliente.

Puede explorar muchas más herramientas de inteligencia artificial y sus aplicaciones. esta página.

punto_img

Información más reciente

punto_img