Logo Zephyrnet

Zmiana rangi 3: Ulepszanie wyszukiwania korporacyjnego i systemów RAG

Data:

Wprowadzenie

Cohere wprowadziło swój podstawowy model nowej generacji, Rerank 3 w zakresie wydajnego wyszukiwania korporacyjnego i Odzyskanie Augmented Generation(SZMATA). Model Rerank jest kompatybilny z każdym rodzajem baza danych lub indeks wyszukiwania, a także można go zintegrować z dowolną aplikacją prawniczą z natywnymi funkcjami wyszukiwania. Nie wyobrażasz sobie, że pojedyncza linia kodu może zwiększyć wydajność wyszukiwania lub zmniejszyć opłatę za uruchomienie Aplikacja RAG z znikomym wpływem na opóźnienia.  

Przyjrzyjmy się, w jaki sposób ten podstawowy model ma ulepszyć systemy wyszukiwania korporacyjnego i RAG, zapewniając większą dokładność i wydajność. 

Zmień rangę 3

Możliwości rerankingu 

Rerank oferuje najlepsze możliwości wyszukiwania korporacyjnego, które obejmują: 

  • Długość kontekstu 4K, która znacznie poprawia jakość wyszukiwania dłuższych dokumentów. 
  • Może przeszukiwać dane wieloaspektowe i częściowo ustrukturyzowane, takie jak tabele, kod, JSON dokumenty, faktury i e-maile. 
  • Może obejmować ponad 100 języków.
  • Większe opóźnienia i obniżony całkowity koszt posiadania (TCO)

Modele generatywne AI z długimi kontekstami mają potencjał do wykonania RAG. Aby poprawić wynik dokładności, opóźnienia i koszt, rozwiązanie RAG musi wymagać kombinacji generacji Modele AI i oczywiście zmień rangę modelu. Precyzyjny reranking semantyczny rerank3 zapewnia, że ​​do modelu generowania trafiają tylko istotne informacje, co zwiększa dokładność odpowiedzi oraz utrzymuje opóźnienia i koszty na bardzo niskim poziomie, szczególnie podczas wyszukiwania informacji z milionów dokumentów. 

Dane przedsiębiorstwa są często bardzo złożone, a obecne systemy umieszczone w organizacji napotykają trudności w przeszukiwaniu wieloaspektowych i częściowo ustrukturyzowanych źródeł danych. Zasadniczo w organizacji najbardziej przydatne dane nie są przechowywane w prostym formacie dokumentu, takim jak JSON, który jest bardzo powszechny w aplikacjach korporacyjnych. Rerank 3 z łatwością potrafi uszeregować złożone, wieloaspektowe wiadomości, takie jak e-maile, na podstawie wszystkich odpowiednich pól metadanych, w tym ich aktualności. 

Ulepszone wyszukiwanie w przedsiębiorstwie
Dokładność wyszukiwania w wielu językach oparta na nDCG@10 na MIRACL (im wyższa, tym lepsza).

Rerank 3 znacznie poprawia skuteczność odzyskiwania kodu. Może to zwiększyć produktywność inżynierów, pomagając im szybciej znajdować właściwe fragmenty kodu, czy to w bazie kodu firmy, czy w rozległych repozytoriach dokumentacji.

Zmień rangę 3 | Ulepszone wyszukiwanie w przedsiębiorstwie
Dokładność oceny kodu w oparciu o nDCG@10 w Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS1000 (wyżej tym lepiej).

Giganci technologiczni również zajmują się wielojęzycznymi źródłami danych, a wcześniej wielojęzyczne wyszukiwanie było największym wyzwaniem w przypadku metod opartych na słowach kluczowych. Modele Rerank 3 oferują wysoką wydajność wielojęzyczną w ponad 100 językach, co upraszcza proces wyszukiwania dla klientów nieanglojęzycznych. 

Ulepszone wyszukiwanie w przedsiębiorstwie
Dokładność wyszukiwania w wielu językach oparta na nDCG@10 na MIRACL (im wyższa, tym lepsza).

Kluczowym wyzwaniem w systemach wyszukiwania semantycznego i RAG jest optymalizacja fragmentacji danych. Rerank 3 rozwiązuje ten problem za pomocą okna kontekstowego 4k, umożliwiającego bezpośrednie przetwarzanie większych dokumentów. Prowadzi to do lepszego uwzględniania kontekstu podczas oceniania trafności.

Zmień rangę 3 | Ulepszone wyszukiwanie w przedsiębiorstwie

Rerank 3 jest również obsługiwany w interfejsie API wnioskowania Elastic. Wyszukiwanie elastyczne ma powszechnie przyjętą technologię wyszukiwania, a możliwości wyszukiwania słów kluczowych i wektorów na platformie Elasticsearch są zbudowane tak, aby efektywnie obsługiwać większe i bardziej złożone dane przedsiębiorstwa. 

„Jesteśmy podekscytowani współpracą z Cohere, która pomoże firmom uwolnić potencjał ich danych” powiedział Matt Riley, wiceprezes i dyrektor generalny Elasticsearch. Zaawansowane modele wyszukiwania Cohere, takie jak Embed 3 i Rerank 3, oferują doskonałą wydajność w przypadku złożonych i dużych danych korporacyjnych. Rozwiązują problemy i stają się niezbędnymi elementami każdego systemu wyszukiwania korporacyjnego. 

Poprawione opóźnienie z dłuższym kontekstem

W wielu obszarach biznesowych, takich jak handel elektroniczny czy obsługa klienta, małe opóźnienia mają kluczowe znaczenie dla zapewnienia wysokiej jakości usług. Mieli to na uwadze podczas tworzenia Rerank 3, który wykazuje do 2x mniejsze opóźnienia w porównaniu do Rerank 2 w przypadku krótszych dokumentów i do 3x ulepszeń w przypadku długich kontekstów.

Zmień rangę 3 | Poprawione opóźnienie z dłuższym kontekstem
Porównania obliczone jako czas uszeregowania 50 dokumentów według różnych profili długości tokenów dokumentów; każdy przebieg zakłada partię 50 dokumentów o jednakowej długości znacznika w każdym dokumencie.

Lepsza wydajność i wydajna RAG

W systemach RAG (Retrieval-Augmented Generation) etap odzyskiwania dokumentów ma kluczowe znaczenie dla ogólnej wydajności. Rerank 3 uwzględnia dwa istotne czynniki zapewniające wyjątkową wydajność RAG: jakość odpowiedzi i opóźnienie. Model ten doskonale wskazuje dokumenty najbardziej odpowiednie dla zapytania użytkownika dzięki możliwościom semantycznego ponownego rankingu.

Ten ukierunkowany proces wyszukiwania bezpośrednio poprawia dokładność odpowiedzi systemu RAG. Umożliwiając efektywne wyszukiwanie istotnych informacji z dużych zbiorów danych, Rerank 3 umożliwia dużym przedsiębiorstwom uwolnienie wartości ich zastrzeżonych danych. Ułatwia to różne funkcje biznesowe, w tym obsługę klienta, kwestie prawne, HR i finanse, dostarczając im najbardziej odpowiednich informacji w celu odpowiedzi na zapytania użytkowników.

Lepsza wydajność i wydajna RAG
Rerank 3 to ekonomiczne rozwiązanie dla RAG w połączeniu z rodziną modeli Command R. Pozwala użytkownikom przekazywać mniej dokumentów do LLM w celu generowania naziemnego, zachowując dokładność i opóźnienia. To sprawia, że ​​RAG z Rerank jest o 80-93% tańszy niż inne generatywne LLM.

Integracja Rerank 3 z ekonomiczną rodziną Command R dla systemów RAG zapewnia użytkownikom znaczną redukcję całkowitego kosztu posiadania (TCO). Osiąga się to poprzez dwa kluczowe czynniki. Po pierwsze, Rerank 3 ułatwia wybór bardzo trafnych dokumentów, wymagając od LLM przetworzenia mniejszej liczby dokumentów w celu wygenerowania uzasadnionej odpowiedzi. Utrzymuje to dokładność reakcji, minimalizując jednocześnie opóźnienia. Po drugie, łączna wydajność modeli Rerank 3 i Command R prowadzi do redukcji kosztów o 80–93% w porównaniu z alternatywnymi generacyjnymi LLM dostępnymi na rynku. W rzeczywistości, biorąc pod uwagę oszczędności wynikające zarówno z Rerank 3, jak i Command R, łączna redukcja kosztów może przekroczyć 98%.

Zmień rangę 3
Koszt samodzielny opiera się na kosztach wnioskowania dla 1 mln podpowiedzi RAG z 50 dokumentami zawierającymi 250 tokenów każdy i 250 tokenami wyjściowymi. Koszt z Rerank jest oparty na kosztach wnioskowania dla 1M podpowiedzi RAG z 5 dokumentami po 250 tokenów każdy i 250 tokenami wyjściowymi.

Coraz bardziej powszechnym i dobrze znanym podejściem do systemów RAG jest wykorzystanie LLM jako narzędzi do zmiany rankingu w procesie wyszukiwania dokumentów. Rerank 3 przewyższa wiodące w branży LLM, takie jak Claude -3 Sonte, GPT Turbo pod względem dokładności rankingu, a jednocześnie jest o 90-98% tańszy. 

Zmień rangę 3
Dokładność w oparciu o nDCG@10 w zestawie danych TREC 2020 (im wyższa, tym lepsza). LLM są oceniane w sposób listowy, zgodnie z podejściem zastosowanym w RankGPT (Sun i in. 2023).

Zmień rangę 3, aby zwiększyć dokładność i jakość reakcji LLM. Pomaga także w obniżeniu całkowitego kosztu posiadania (TCO). Rerank osiąga to poprzez odsiewanie mniej istotnych dokumentów i sortowanie jedynie niewielkiego podzbioru odpowiednich dokumentów w celu uzyskania odpowiedzi.

Wnioski

Rerank 3 to rewolucyjne narzędzie do wyszukiwania korporacyjnego i systemów RAG. Umożliwia wysoką dokładność w obsłudze złożonych struktur danych i wielu języków. Rerank 3 minimalizuje fragmentację danych, redukując opóźnienia i całkowity koszt posiadania. Skutkuje to szybszymi wynikami wyszukiwania i opłacalnymi wdrożeniami RAG. Integruje się z Elasticsearch w celu lepszego podejmowania decyzji i obsługi klientów.

Możesz poznać znacznie więcej takich narzędzi AI i ich zastosowań tutaj.

spot_img

Najnowsza inteligencja

spot_img