Zephyrnet Logo

Reclassificação 3: Impulsionando a pesquisa empresarial e os sistemas RAG

Data:

Introdução

Cohere apresentou seu modelo básico de próxima geração, Rerank 3 para pesquisa empresarial eficiente e Geração Aumentada de Recuperação(RAG). O modelo Rerank é compatível com qualquer tipo de banco de dados ou índice de pesquisa e também pode ser integrado a qualquer aplicação jurídica com recursos de pesquisa nativos. Você não vai imaginar que uma única linha de código pode aumentar o desempenho da pesquisa ou reduzir o custo de execução de um Aplicação RAG com impacto insignificante na latência.  

Vamos explorar como esse modelo básico é definido para promover a pesquisa corporativa e os sistemas RAG, com maior precisão e eficiência. 

Reclassificar 3

Capacidades de reclassificação 

Rerank oferece os melhores recursos para pesquisa corporativa, que incluem o seguinte: 

  • Comprimento de contexto de 4K que melhora significativamente a qualidade da pesquisa para documentos de formato mais longo. 
  • Ele pode pesquisar dados multiaspectos e semiestruturados, como tabelas, código, JSON documentos, faturas e e-mails. 
  • Pode abranger mais de 100 idiomas.
  • Latência aprimorada e custo total de propriedade (TCO) reduzido

Modelos generativos de IA com contextos longos têm o potencial de executar um RAG. Para melhorar a pontuação de precisão, a latência e o custo, a solução RAG deve exigir uma combinação de geração Modelos de IA e, claro, modelo Rerank. A reclassificação semântica de alta precisão do rerank3 garante que apenas as informações relevantes sejam alimentadas no modelo de geração, o que aumenta a precisão da resposta e mantém a latência e o custo muito baixos, especialmente ao recuperar informações de milhões de documentos. 

Os dados empresariais são muitas vezes muito complexos e os sistemas atuais colocados na organização encontram dificuldades na pesquisa em fontes de dados semiestruturadas e multiaspectos. Principalmente, na organização, os dados mais úteis não estão no formato de documento simples, como o JSON, que é muito comum em aplicativos corporativos. O Rerank 3 é facilmente capaz de classificar e-mails complexos e de vários aspectos, como e-mails, com base em todos os seus campos de metadados relevantes, incluindo sua atualidade. 

Pesquisa empresarial aprimorada
Precisão de recuperação multilíngue baseada em nDCG@10 no MIRACL (quanto maior, melhor).

A reclassificação 3 melhora significativamente a qualidade da recuperação do código. Isso pode aumentar a produtividade dos engenheiros, ajudando-os a encontrar os trechos de código certos com mais rapidez, seja na base de código da empresa ou em vastos repositórios de documentação.

Reclassificação 3 | Pesquisa empresarial aprimorada
Precisão da avaliação de código baseada em nDCG@10 em Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS1000 (quanto maior, melhor).

Os gigantes da tecnologia também lidam com fontes de dados multilíngues e a recuperação anteriormente multilíngue tem sido o maior desafio com métodos baseados em palavras-chave. Os modelos Rerank 3 oferecem um forte desempenho multilíngue com mais de 100 idiomas, simplificando o processo de recuperação para clientes que não falam inglês. 

Pesquisa empresarial aprimorada
Precisão de recuperação multilíngue baseada em nDCG@10 no MIRACL (quanto maior, melhor).

Um desafio importante na pesquisa semântica e nos sistemas RAG é a otimização do agrupamento de dados. A Reclassificação 3 aborda isso com uma janela de contexto de 4k, permitindo o processamento direto de documentos maiores. Isso leva a uma melhor consideração do contexto durante a pontuação de relevância.

Reclassificação 3 | Pesquisa empresarial aprimorada

A reclassificação 3 também é compatível com a API de inferência da Elastic. O Elastic Search tem uma tecnologia de pesquisa amplamente adotada e os recursos de pesquisa por palavras-chave e vetores na plataforma Elasticsearch são desenvolvidos para lidar com dados corporativos maiores e mais complexos com eficiência. 

“Estamos entusiasmados com a parceria com a Cohere para ajudar as empresas a aproveitar o potencial de seus dados”, disse Matt Riley, vice-presidente executivo e gerente geral da Elasticsearch. Os modelos de recuperação avançados da Cohere, Embed 3 e Rerank 3, oferecem excelente desempenho em dados corporativos complexos e grandes. Eles são o seu solucionador de problemas e estão se tornando componentes essenciais em qualquer sistema de pesquisa empresarial. 

Latência aprimorada com contexto mais longo

Em muitos domínios de negócios, como comércio eletrônico ou atendimento ao cliente, a baixa latência é crucial para proporcionar uma experiência de qualidade. Eles tiveram isso em mente ao criar a Reclassificação 3, que mostra latência até 2x menor em comparação com a Reclassificação 2 para comprimentos de documentos mais curtos e melhorias de até 3x em comprimentos de contexto longos.

Reclassificação 3 | Latência aprimorada com contexto mais longo
Comparações calculadas como o tempo para classificar 50 documentos em uma variedade de perfis de tamanho de token de documento; cada execução pressupõe um lote de 50 documentos com comprimento de token uniforme em cada documento.

Melhor desempenho e RAG eficiente

Em sistemas de geração aumentada de recuperação (RAG), o estágio de recuperação de documentos é fundamental para o desempenho geral. A reclassificação 3 aborda dois fatores essenciais para um desempenho RAG excepcional: qualidade de resposta e latência. O modelo é excelente na identificação dos documentos mais relevantes para a consulta de um usuário por meio de seus recursos de reclassificação semântica.

Este processo de recuperação direcionado melhora diretamente a precisão das respostas do sistema RAG. Ao permitir a recuperação eficiente de informações pertinentes de grandes conjuntos de dados, o Rerank 3 permite que grandes empresas liberem o valor de seus dados proprietários. Isso facilita várias funções de negócios, incluindo suporte ao cliente, jurídico, RH e finanças, fornecendo-lhes as informações mais relevantes para atender às dúvidas dos usuários.

Melhor desempenho e RAG eficiente
O Rerank 3 é uma solução econômica para RAG quando combinado com a família de modelos Command R. Ele permite que os usuários passem menos documentos para o LLM para geração fundamentada, mantendo a precisão e a latência. Isso torna o RAG com Rerank 80-93% mais barato do que outros LLMs generativos.

A integração do Rerank 3 com a econômica família Command R para sistemas RAG oferece uma redução significativa no custo total de propriedade (TCO) para os usuários. Isto é conseguido através de dois fatores principais. Em primeiro lugar, a Reclassificação 3 facilita a seleção de documentos altamente relevantes, exigindo que o LLM processe menos documentos para geração de respostas fundamentadas. Isso mantém a precisão da resposta enquanto minimiza a latência. Em segundo lugar, a eficiência combinada dos modelos Rerank 3 e Command R leva a reduções de custos de 80-93% em comparação com LLMs generativos alternativos no mercado. Na verdade, ao considerar as economias de custos da Reclassificação 3 e do Comando R, as reduções totais de custos podem ultrapassar 98%.

Reclassificar 3
O custo independente é baseado nos custos de inferência para 1 milhão de prompts RAG com 50 documentos contendo 250 tokens cada e 250 tokens de saída. O custo com reclassificação é baseado nos custos de inferência para 1 milhão de prompts RAG com 5 documentos com 250 tokens cada e 250 tokens de saída.

Uma abordagem cada vez mais comum e conhecida para sistemas RAG é usar LLMs como reclassificadores para o processo de recuperação de documentos. Rerank 3 supera LLMs líderes do setor, como Claude -3 Sonte, GPT Turbo em precisão de classificação, sendo 90-98% mais barato. 

Reclassificar 3
Precisão baseada em nDCG@10 no conjunto de dados TREC 2020 (quanto maior, melhor). Os LLMs são avaliados em forma de lista seguindo a abordagem usada no RankGPT (Sun et al. 2023).

A reclassificação 3 aumenta a precisão e a qualidade da resposta LLM. Também ajuda a reduzir o TCO de ponta a ponta. A Reclassificação consegue isso eliminando nossos documentos menos relevantes e classificando apenas o pequeno subconjunto de documentos relevantes para obter respostas.

Conclusão

Rerank 3 é uma ferramenta revolucionária para pesquisa corporativa e sistemas RAG. Ele permite alta precisão no manuseio de estruturas de dados complexas e vários idiomas. A reclassificação 3 minimiza a fragmentação de dados, reduzindo a latência e o custo total de propriedade. Isso resulta em resultados de pesquisa mais rápidos e implementações RAG econômicas. Ele se integra ao Elasticsearch para melhorar a tomada de decisões e a experiência do cliente.

Você pode explorar muito mais ferramentas de IA e suas aplicações SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

local_img

Inteligência mais recente

local_img