जेफिरनेट लोगो

रीरैंक 3: एंटरप्राइज सर्च और आरएजी सिस्टम को बढ़ावा देना

दिनांक:

परिचय

कोहेयर ने कुशल एंटरप्राइज सर्च के लिए अपना अगली पीढ़ी का फाउंडेशन मॉडल, रीरैंक 3 पेश किया पुनर्प्राप्ति संवर्धित पीढ़ी(आरएजी)। रेरैंक मॉडल किसी भी प्रकार के साथ संगत है डेटाबेस या खोज सूचकांक और इसे मूल खोज क्षमताओं के साथ किसी भी कानूनी एप्लिकेशन में भी एकीकृत किया जा सकता है। आप कल्पना नहीं करेंगे, कि कोड की एक पंक्ति खोज प्रदर्शन को बढ़ावा दे सकती है या चलाने का शुल्क कम कर सकती है आरएजी आवेदन विलंबता पर नगण्य प्रभाव के साथ.  

आइए देखें कि यह फाउंडेशन मॉडल बढ़ी हुई सटीकता और दक्षता के साथ उद्यम खोज और आरएजी सिस्टम को आगे बढ़ाने के लिए कैसे तैयार किया गया है। 

पुनर्रैंक 3

रीरैंक की क्षमताएं 

रीरैंक उद्यम खोज के लिए सर्वोत्तम क्षमताएं प्रदान करता है जिसमें निम्नलिखित शामिल हैं: 

  • 4K संदर्भ लंबाई जो लंबे प्रारूप वाले दस्तावेज़ों के लिए खोज गुणवत्ता को महत्वपूर्ण रूप से बढ़ाती है। 
  • यह टेबल, कोड जैसे बहु-पहलू और अर्ध-संरचित डेटा की खोज कर सकता है। JSON दस्तावेज़, चालान और ईमेल। 
  • यह 100 से अधिक भाषाओं को कवर कर सकता है।
  • बढ़ी हुई विलंबता और स्वामित्व की कुल लागत में कमी (TCO)

जनरेटिव एआई मॉडल लंबे संदर्भों के साथ RAG निष्पादित करने की क्षमता होती है। सटीकता स्कोर, विलंबता और लागत को बढ़ाने के लिए आरएजी समाधान को पीढ़ी के संयोजन की आवश्यकता होनी चाहिए एआई मॉडल और निश्चित रूप से रीरैंक मॉडल। रीरैंक3 की उच्च परिशुद्धता सिमेंटिक रीरैंकिंग यह सुनिश्चित करती है कि केवल प्रासंगिक जानकारी ही जेनरेशन मॉडल में फीड की जाती है जो प्रतिक्रिया सटीकता को बढ़ाती है और विलंबता और लागत को बहुत कम रखती है, विशेष रूप से लाखों दस्तावेजों से जानकारी पुनर्प्राप्त करते समय। 

एंटरप्राइज़ डेटा अक्सर बहुत जटिल होता है और संगठन में रखे गए मौजूदा सिस्टम को बहु-पहलू और अर्ध-संरचित डेटा स्रोतों के माध्यम से खोज करने में कठिनाइयों का सामना करना पड़ता है। प्रमुख रूप से, संगठन में सबसे उपयोगी डेटा सरल दस्तावेज़ प्रारूप में नहीं होता है जैसे कि JSON सभी एंटरप्राइज़ अनुप्रयोगों में बहुत आम है। रीरैंक 3 ईमेल जैसे जटिल, बहु-पहलू को उनकी नवीनतमता सहित उनके सभी प्रासंगिक मेटाडेटा फ़ील्ड के आधार पर आसानी से रैंक करने में सक्षम है। 

उन्नत उद्यम खोज
MIRACL पर बहुभाषी पुनर्प्राप्ति सटीकता आधारित nDCG@10 (उच्चतर बेहतर है)।

रीरैंक 3 महत्वपूर्ण रूप से सुधार करता है कि यह कोड को कितनी अच्छी तरह पुनः प्राप्त करता है। यह इंजीनियर की उत्पादकता को बढ़ावा दे सकता है, जिससे उन्हें सही कोड स्निपेट तेजी से ढूंढने में मदद मिल सकती है, चाहे वह उनकी कंपनी के कोडबेस के भीतर हो या विशाल दस्तावेज़ रिपॉजिटरी में हो।

पुनर्रैंक 3 | उन्नत उद्यम खोज
Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS10 (उच्चतर बेहतर है) पर nDCG@1000 पर आधारित कोड मूल्यांकन सटीकता।

टेक दिग्गज भी बहुभाषी डेटा स्रोतों से निपटते हैं और पहले बहुभाषी पुनर्प्राप्ति कीवर्ड-आधारित तरीकों के साथ सबसे बड़ी चुनौती रही है। रेरैंक 3 मॉडल 100 से अधिक भाषाओं के साथ एक मजबूत बहुभाषी प्रदर्शन प्रदान करते हैं जो गैर-अंग्रेजी भाषी ग्राहकों के लिए पुनर्प्राप्ति प्रक्रिया को सरल बनाते हैं। 

उन्नत उद्यम खोज
MIRACL पर बहुभाषी पुनर्प्राप्ति सटीकता आधारित nDCG@10 (उच्चतर बेहतर है)।

सिमेंटिक सर्च और आरएजी सिस्टम में एक प्रमुख चुनौती डेटा चंकिंग अनुकूलन है। रीरैंक 3 इसे 4k संदर्भ विंडो के साथ संबोधित करता है, जिससे बड़े दस्तावेज़ों की सीधी प्रोसेसिंग सक्षम हो जाती है। इससे प्रासंगिकता स्कोरिंग के दौरान संदर्भ पर विचार में सुधार होता है।

पुनर्रैंक 3 | उन्नत उद्यम खोज

रीरैंक 3 इलास्टिक के इंफ़रेंस एपीआई में भी समर्थित है। इलास्टिक खोज में व्यापक रूप से अपनाई गई खोज तकनीक है और इलास्टिक खोज प्लेटफ़ॉर्म में कीवर्ड और वेक्टर खोज क्षमताएं बड़े और अधिक जटिल एंटरप्राइज़ डेटा को कुशलतापूर्वक संभालने के लिए बनाई गई हैं। 

इलास्टिकसर्च के जीवीपी और जीएम मैट रिले ने कहा, "हम व्यवसायों को उनके डेटा की क्षमता को अनलॉक करने में मदद करने के लिए कोहेरे के साथ साझेदारी करके उत्साहित हैं।" कोहेयर के उन्नत पुनर्प्राप्ति मॉडल जो एंबेड 3 और रेरैंक 3 हैं, जटिल और बड़े उद्यम डेटा पर उत्कृष्ट प्रदर्शन प्रदान करते हैं। वे आपकी समस्या का समाधान करते हैं, ये किसी भी उद्यम खोज प्रणाली में आवश्यक घटक बनते जा रहे हैं। 

लंबे संदर्भ के साथ बेहतर विलंबता

ई-कॉमर्स या ग्राहक सेवा जैसे कई व्यावसायिक डोमेन में, गुणवत्तापूर्ण अनुभव प्रदान करने के लिए कम विलंबता महत्वपूर्ण है। रीरैंक 3 का निर्माण करते समय उन्होंने इसे ध्यान में रखा, जो छोटी दस्तावेज़ लंबाई के लिए रीरैंक 2 की तुलना में 2 गुना कम विलंबता और लंबी संदर्भ लंबाई पर 3 गुना तक सुधार दिखाता है।

पुनर्रैंक 3 | लंबे संदर्भ के साथ बेहतर विलंबता
विभिन्न दस्तावेज़ टोकन-लंबाई प्रोफाइल में 50 दस्तावेज़ों को रैंक करने के समय के रूप में तुलना की गणना की गई; प्रत्येक रन में प्रत्येक दस्तावेज़ में समान टोकन लंबाई के साथ 50 दस्तावेज़ों का एक बैच माना जाता है।

बेहतर प्रदर्शन और कुशल आरएजी

पुनर्प्राप्ति-संवर्धित पीढ़ी (आरएजी) प्रणालियों में, दस्तावेज़ पुनर्प्राप्ति चरण समग्र प्रदर्शन के लिए महत्वपूर्ण है। रेरैंक 3 असाधारण आरएजी प्रदर्शन के लिए दो आवश्यक कारकों को संबोधित करता है: प्रतिक्रिया गुणवत्ता और विलंबता। मॉडल अपनी सिमेंटिक रीरैंकिंग क्षमताओं के माध्यम से उपयोगकर्ता की क्वेरी के लिए सबसे प्रासंगिक दस्तावेज़ों को इंगित करने में उत्कृष्टता प्राप्त करता है।

यह लक्षित पुनर्प्राप्ति प्रक्रिया सीधे आरएजी प्रणाली की प्रतिक्रियाओं की सटीकता में सुधार करती है। बड़े डेटासेट से प्रासंगिक जानकारी की कुशल पुनर्प्राप्ति को सक्षम करके, रीरैंक 3 बड़े उद्यमों को उनके मालिकाना डेटा के मूल्य को अनलॉक करने का अधिकार देता है। यह उपयोगकर्ता के प्रश्नों को संबोधित करने के लिए सबसे प्रासंगिक जानकारी प्रदान करके ग्राहक सहायता, कानूनी, मानव संसाधन और वित्त सहित विभिन्न व्यावसायिक कार्यों को सुविधाजनक बनाता है।

बेहतर प्रदर्शन और कुशल आरएजी
मॉडलों के कमांड आर परिवार के साथ संयुक्त होने पर रीरैंक 3 आरएजी के लिए एक लागत प्रभावी समाधान है। यह उपयोगकर्ताओं को सटीकता और विलंबता बनाए रखते हुए, ग्राउंडेड जेनरेशन के लिए एलएलएम में कम दस्तावेज़ पास करने की अनुमति देता है। यह रीरैंक के साथ आरएजी को अन्य जेनेरिक एलएलएम की तुलना में 80-93% कम महंगा बनाता है।

आरएजी सिस्टम के लिए लागत प्रभावी कमांड आर परिवार के साथ रीरैंक 3 को एकीकृत करने से उपयोगकर्ताओं के लिए स्वामित्व की कुल लागत (टीसीओ) में महत्वपूर्ण कमी आती है। यह दो प्रमुख कारकों के माध्यम से हासिल किया गया है। सबसे पहले, रीरैंक 3 अत्यधिक प्रासंगिक दस्तावेज़ चयन की सुविधा प्रदान करता है, जिससे एलएलएम को ग्राउंडेड प्रतिक्रिया पीढ़ी के लिए कम दस्तावेज़ों को संसाधित करने की आवश्यकता होती है। यह विलंबता को कम करते हुए प्रतिक्रिया सटीकता बनाए रखता है। दूसरे, रेरैंक 3 और कमांड आर मॉडल की संयुक्त दक्षता से बाजार में वैकल्पिक जेनेरिक एलएलएम की तुलना में लागत में 80-93% की कमी आती है। वास्तव में, जब रीरैंक 3 और कमांड आर दोनों से लागत बचत पर विचार किया जाता है, तो कुल लागत में कटौती 98% से अधिक हो सकती है।

पुनर्रैंक 3
स्टैंडअलोन लागत 1M RAG प्रॉम्प्ट के लिए अनुमान लागत पर आधारित है, जिसमें 50 दस्तावेज़ों में से प्रत्येक में 250 टोकन और 250 आउटपुट टोकन हैं। रीरैंक के साथ लागत 1एम आरएजी प्रॉम्प्ट के लिए अनुमान लागत पर आधारित है, जिसमें 5 डॉक्स @ 250 टोकन प्रत्येक और 250 आउटपुट टोकन हैं।

आरएजी सिस्टम के लिए एक तेजी से सामान्य और प्रसिद्ध दृष्टिकोण दस्तावेज़ पुनर्प्राप्ति प्रक्रिया के लिए एलएलएम को पुनर्रैंकर के रूप में उपयोग करना है। रीरैंक 3 3-90% कम खर्चीला होने के बावजूद रैंकिंग सटीकता के मामले में क्लाउड -98 सोंटे, जीपीटी टर्बो जैसे उद्योग-अग्रणी एलएलएम से बेहतर प्रदर्शन करता है। 

पुनर्रैंक 3
TREC 10 डेटासेट पर nDCG@2020 पर आधारित सटीकता (उच्चतर बेहतर है)। एलएलएम का मूल्यांकन रैंकजीपीटी (सन एट अल 2023) में प्रयुक्त दृष्टिकोण के बाद सूची-वार तरीके से किया जाता है।

रीरैंक 3 एलएलएम प्रतिक्रिया की सटीकता और गुणवत्ता को बढ़ावा देता है। यह एंड-टू-एंड टीसीओ को कम करने में भी मदद करता है। रेरैंक हमारे कम प्रासंगिक दस्तावेज़ों को छांटकर और उत्तर निकालने के लिए केवल प्रासंगिक दस्तावेज़ों के छोटे उपसमूह को छांटकर इसे प्राप्त करता है।

निष्कर्ष

रीरैंक 3 एंटरप्राइज़ खोज और आरएजी सिस्टम के लिए एक क्रांतिकारी उपकरण है। यह जटिल डेटा संरचनाओं और कई भाषाओं को संभालने में उच्च सटीकता को सक्षम बनाता है। रीरैंक 3 डेटा चंकिंग को कम करता है, विलंबता और स्वामित्व की कुल लागत को कम करता है। इसके परिणामस्वरूप तेज़ खोज परिणाम और लागत प्रभावी आरएजी कार्यान्वयन होता है। यह बेहतर निर्णय लेने और ग्राहक अनुभवों के लिए इलास्टिक्स खोज के साथ एकीकृत होता है।

आप ऐसे कई और एआई टूल और उनके अनुप्रयोगों का पता लगा सकते हैं यहाँ उत्पन्न करें.

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी