Logo Zephyrnet

Xếp hạng lại 3: Tăng cường Hệ thống RAG và Tìm kiếm Doanh nghiệp

Ngày:

Giới thiệu

Cohere đã giới thiệu mô hình nền tảng thế hệ tiếp theo, Rerank 3 để tìm kiếm doanh nghiệp hiệu quả và Truy xuất thế hệ tăng cường(GIẺ). Mô hình Rerank tương thích với mọi loại cơ sở dữ liệu hoặc chỉ mục tìm kiếm và cũng có thể được tích hợp vào bất kỳ ứng dụng pháp lý nào có khả năng tìm kiếm gốc. Bạn sẽ không tưởng tượng được rằng một dòng mã có thể tăng hiệu suất tìm kiếm hoặc giảm chi phí chạy một trang web. ứng dụng RAG với tác động không đáng kể đến độ trễ.  

Hãy cùng khám phá cách thiết lập mô hình nền tảng này để nâng cao hệ thống RAG và tìm kiếm doanh nghiệp với độ chính xác và hiệu quả được nâng cao. 

Xếp hạng lại 3

Khả năng của Rerank 

Rerank cung cấp các khả năng tìm kiếm doanh nghiệp tốt nhất, bao gồm: 

  • Độ dài ngữ cảnh 4K giúp nâng cao đáng kể chất lượng tìm kiếm cho các tài liệu dạng dài hơn. 
  • Nó có thể tìm kiếm trên dữ liệu đa khía cạnh và bán cấu trúc như bảng, mã, JSON tài liệu, hóa đơn và email. 
  • Nó có thể bao gồm hơn 100 ngôn ngữ.
  • Tăng cường độ trễ và giảm tổng chi phí sở hữu (TCO)

Các mô hình AI sáng tạo với bối cảnh dài có khả năng thực thi RAG. Để nâng cao điểm chính xác, độ trễ và chi phí, giải pháp RAG phải yêu cầu sự kết hợp giữa việc tạo Mô hình AI và tất nhiên là mô hình Xếp hạng lại. Việc sắp xếp lại ngữ nghĩa có độ chính xác cao của rerank3 đảm bảo rằng chỉ những thông tin liên quan mới được cung cấp cho mô hình tạo, giúp tăng độ chính xác của phản hồi và giữ độ trễ cũng như chi phí ở mức rất thấp, đặc biệt là khi truy xuất thông tin từ hàng triệu tài liệu. 

Dữ liệu doanh nghiệp thường rất phức tạp và các hệ thống hiện tại được đặt trong tổ chức gặp khó khăn khi tìm kiếm thông qua các nguồn dữ liệu bán cấu trúc và đa khía cạnh. Chủ yếu, trong tổ chức, dữ liệu hữu ích nhất không ở định dạng tài liệu đơn giản như JSON vốn rất phổ biến trên các ứng dụng doanh nghiệp. Rerank 3 có thể dễ dàng xếp hạng các email phức tạp, đa khía cạnh, chẳng hạn như email dựa trên tất cả các trường siêu dữ liệu có liên quan, bao gồm cả lần truy cập gần đây của chúng. 

Tìm kiếm doanh nghiệp nâng cao
Độ chính xác truy xuất đa ngôn ngữ dựa trên nDCG@10 trên MIRACL (càng cao càng tốt).

Xếp hạng lại 3 cải thiện đáng kể khả năng truy xuất mã của nó. Điều này có thể nâng cao năng suất của kỹ sư bằng cách giúp họ tìm thấy đoạn mã phù hợp nhanh hơn, cho dù trong cơ sở mã của công ty họ hay trên các kho tài liệu rộng lớn.

Xếp hạng lại 3 | Tìm kiếm doanh nghiệp nâng cao
Độ chính xác đánh giá mã dựa trên nDCG@10 trên Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS1000 (càng cao càng tốt).

Những gã khổng lồ công nghệ cũng xử lý các nguồn dữ liệu đa ngôn ngữ và việc truy xuất đa ngôn ngữ trước đây là thách thức lớn nhất với các phương pháp dựa trên từ khóa. Các mô hình Rerank 3 cung cấp hiệu suất đa ngôn ngữ mạnh mẽ với hơn 100 ngôn ngữ giúp đơn giản hóa quá trình truy xuất cho những khách hàng không nói tiếng Anh. 

Tìm kiếm doanh nghiệp nâng cao
Độ chính xác truy xuất đa ngôn ngữ dựa trên nDCG@10 trên MIRACL (càng cao càng tốt).

Một thách thức chính trong hệ thống RAG và tìm kiếm ngữ nghĩa là tối ưu hóa phân khối dữ liệu. Xếp hạng lại 3 giải quyết vấn đề này bằng cửa sổ ngữ cảnh 4k, cho phép xử lý trực tiếp các tài liệu lớn hơn. Điều này dẫn đến việc cải thiện việc xem xét bối cảnh trong quá trình chấm điểm mức độ liên quan.

Xếp hạng lại 3 | Tìm kiếm doanh nghiệp nâng cao

Rerank 3 cũng được hỗ trợ trong API suy luận của Elastic. Tìm kiếm đàn hồi có công nghệ tìm kiếm được áp dụng rộng rãi và khả năng tìm kiếm từ khóa và vectơ trong nền tảng Elaticsearch được xây dựng để xử lý dữ liệu doanh nghiệp lớn hơn và phức tạp hơn một cách hiệu quả. 

Matt Riley, GVP và GM của Elaticsearch cho biết: “Chúng tôi rất vui mừng được hợp tác với Cohere để giúp các doanh nghiệp khai thác tiềm năng dữ liệu của họ”. Các mô hình truy xuất nâng cao của Cohere là Embed 3 và Rerank 3 mang lại hiệu suất tuyệt vời trên dữ liệu doanh nghiệp lớn và phức tạp. Chúng là người giải quyết vấn đề của bạn, chúng đang trở thành những thành phần thiết yếu trong bất kỳ hệ thống tìm kiếm doanh nghiệp nào. 

Độ trễ được cải thiện với bối cảnh dài hơn

Trong nhiều lĩnh vực kinh doanh như thương mại điện tử hoặc dịch vụ khách hàng, độ trễ thấp là yếu tố quan trọng để mang lại trải nghiệm chất lượng. Họ đã ghi nhớ điều này khi xây dựng Rerank 3, tính năng này có độ trễ thấp hơn tới 2 lần so với Rerank 2 để có độ dài tài liệu ngắn hơn và cải thiện tới 3 lần ở độ dài ngữ cảnh dài.

Xếp hạng lại 3 | Độ trễ được cải thiện với bối cảnh dài hơn
Các so sánh được tính là thời gian để xếp hạng 50 tài liệu trên nhiều cấu hình có độ dài mã thông báo tài liệu khác nhau; mỗi lần chạy giả định một lô gồm 50 tài liệu có độ dài mã thông báo thống nhất trên mỗi tài liệu.

Hiệu suất tốt hơn và RAG hiệu quả

Trong các hệ thống Thế hệ tăng cường truy xuất (RAG), giai đoạn truy xuất tài liệu rất quan trọng đối với hiệu suất tổng thể. Xếp hạng lại 3 giải quyết hai yếu tố thiết yếu để có hiệu suất RAG vượt trội: chất lượng phản hồi và độ trễ. Mô hình này vượt trội trong việc xác định chính xác các tài liệu phù hợp nhất với truy vấn của người dùng thông qua khả năng sắp xếp lại ngữ nghĩa của nó.

Quá trình truy xuất có mục tiêu này trực tiếp cải thiện độ chính xác của các phản hồi của hệ thống RAG. Bằng cách cho phép truy xuất hiệu quả thông tin thích hợp từ các tập dữ liệu lớn, Rerank 3 trao quyền cho các doanh nghiệp lớn khai thác giá trị dữ liệu độc quyền của họ. Điều này tạo điều kiện thuận lợi cho các chức năng kinh doanh khác nhau, bao gồm hỗ trợ khách hàng, pháp lý, nhân sự và tài chính, bằng cách cung cấp cho họ những thông tin phù hợp nhất để giải quyết các thắc mắc của người dùng.

Hiệu suất tốt hơn và RAG hiệu quả
Rerank 3 là giải pháp tiết kiệm chi phí cho RAG khi kết hợp với dòng mô hình Command R. Nó cho phép người dùng chuyển ít tài liệu hơn tới LLM để tạo nền tảng, duy trì độ chính xác và độ trễ. Điều này làm cho RAG với Rerank rẻ hơn 80-93% so với các LLM tổng quát khác.

Việc tích hợp Rerank 3 với dòng Command R tiết kiệm chi phí cho hệ thống RAG giúp giảm đáng kể Tổng chi phí sở hữu (TCO) cho người dùng. Điều này đạt được thông qua hai yếu tố chính. Thứ nhất, Xếp hạng lại 3 tạo điều kiện thuận lợi cho việc lựa chọn tài liệu có mức độ liên quan cao, yêu cầu LLM xử lý ít tài liệu hơn để tạo ra phản hồi có căn cứ. Điều này duy trì độ chính xác của phản hồi trong khi giảm thiểu độ trễ. Thứ hai, hiệu quả kết hợp của mô hình Rerank 3 và Command R giúp giảm chi phí 80-93% so với các LLM tổng hợp thay thế trên thị trường. Trên thực tế, khi xem xét mức tiết kiệm chi phí từ cả Rerank 3 và Command R, tổng mức giảm chi phí có thể vượt quá 98%.

Xếp hạng lại 3
Chi phí độc lập dựa trên chi phí suy luận cho 1 triệu lời nhắc RAG với 50 tài liệu chứa 250 mã thông báo mỗi tài liệu và 250 mã thông báo đầu ra. Chi phí với Xếp hạng lại dựa trên chi phí suy luận cho 1 triệu lời nhắc RAG với 5 tài liệu @ 250 mã thông báo mỗi tài liệu và 250 mã thông báo đầu ra.

Một cách tiếp cận ngày càng phổ biến và nổi tiếng đối với các hệ thống RAG là sử dụng LLM làm công cụ sắp xếp lại cho quá trình truy xuất tài liệu. Rerank 3 vượt trội so với các LLM hàng đầu trong ngành như Claude -3 Sonte, GPT Turbo về độ chính xác xếp hạng trong khi rẻ hơn 90-98%. 

Xếp hạng lại 3
Độ chính xác dựa trên nDCG@10 trên bộ dữ liệu TREC 2020 (càng cao càng tốt). LLM được đánh giá theo kiểu danh sách theo cách tiếp cận được sử dụng trong RankGPT (Sun và cộng sự 2023).

Xếp hạng lại 3 tăng cường độ chính xác và chất lượng của phản hồi LLM. Nó cũng giúp giảm TCO từ đầu đến cuối. Xếp hạng lại đạt được điều này bằng cách loại bỏ các tài liệu ít liên quan hơn của chúng tôi và chỉ sắp xếp qua một tập hợp con nhỏ các tài liệu có liên quan để rút ra câu trả lời.

Kết luận

Rerank 3 là một công cụ mang tính cách mạng cho hệ thống tìm kiếm doanh nghiệp và RAG. Nó cho phép độ chính xác cao trong việc xử lý các cấu trúc dữ liệu phức tạp và nhiều ngôn ngữ. Xếp hạng lại 3 giảm thiểu việc phân chia dữ liệu, giảm độ trễ và tổng chi phí sở hữu. Điều này mang lại kết quả tìm kiếm nhanh hơn và triển khai RAG hiệu quả về mặt chi phí. Nó tích hợp với Elaticsearch để cải thiện việc ra quyết định và trải nghiệm của khách hàng.

Bạn có thể khám phá thêm nhiều công cụ AI như vậy và ứng dụng của chúng tại đây.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img