Zephyrnet Logosu

Derece 3: Kurumsal Arama ve RAG Sistemlerini Güçlendirme

Tarih:

Giriş

Cohere, verimli Kurumsal Arama için yeni nesil temel modeli Rerank 3'ü tanıttı ve Alma Artırılmış Nesil(RAG). Rerank modeli her türlü cihazla uyumludur. veritabanı veya arama dizini ve yerel arama yetenekleriyle herhangi bir yasal uygulamaya da entegre edilebilir. Tek bir kod satırının arama performansını artırabileceğini veya bir arama çalıştırma maliyetini azaltabileceğini hayal bile edemezsiniz. RAG uygulaması gecikme üzerinde ihmal edilebilir bir etkiye sahiptir.  

Bu temel modelin kurumsal arama ve RAG sistemlerini gelişmiş doğruluk ve verimlilikle geliştirmek için nasıl ayarlandığını inceleyelim. 

3'ü yeniden sırala

Yeniden Sıralama Yetenekleri 

Rerank, kurumsal arama için aşağıdakileri içeren en iyi yetenekleri sunar: 

  • Daha uzun biçimli belgeler için arama kalitesini önemli ölçüde artıran 4K bağlam uzunluğu. 
  • Tablolar, kodlar gibi çok yönlü ve yarı yapılandırılmış veriler üzerinde arama yapabilir. JSON belgeler, faturalar ve e-postalar. 
  • 100'den fazla dili kapsayabilir.
  • Arttırılmış gecikme süresi ve azaltılmış toplam sahip olma maliyeti (TCO)

Üretken yapay zeka modelleri uzun bağlamlarda bir RAG yürütme potansiyeli vardır. Doğruluk puanını, gecikmeyi ve maliyeti artırmak için RAG çözümünün bir üretim kombinasyonu gerektirmesi gerekir. AI modelleri ve tabii ki Rerank modeli. Yeniden sıralama3'ün yüksek hassasiyetli semantik yeniden sıralaması, üretim modeline yalnızca ilgili bilgilerin beslenmesini sağlar; bu da yanıt doğruluğunu artırır ve özellikle milyonlarca belgeden bilgi alınırken gecikmeyi ve maliyeti çok düşük tutar. 

Kurumsal veriler genellikle çok karmaşıktır ve organizasyona yerleştirilmiş mevcut sistemler, çok yönlü ve yarı yapılandırılmış veri kaynakları aracılığıyla arama yaparken zorluklarla karşılaşmaktadır. Büyük ölçüde, kuruluştaki en yararlı veriler, kurumsal uygulamalarda çok yaygın olan JSON gibi basit belge biçiminde değildir. Rerank 3, e-postalar gibi karmaşık, çok yönlü öğeleri, güncellikleri de dahil olmak üzere ilgili meta veri alanlarına göre kolayca sıralayabilir. 

Gelişmiş Kurumsal Arama
MIRACL'de nDCG@10'a dayalı çok dilli erişim doğruluğu (daha yüksek daha iyidir).

Rerank 3, kodu alma becerisini önemli ölçüde artırır. Bu, ister şirketlerinin kod tabanında ister geniş belge havuzlarında doğru kod parçacıklarını daha hızlı bulmalarına yardımcı olarak mühendislerin üretkenliğini artırabilir.

Yeniden Sırala 3 | Gelişmiş Kurumsal Arama
Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS10'deki nDCG@1000'a dayalı kod değerlendirme doğruluğu (daha yüksek daha iyidir).

Teknoloji devleri aynı zamanda çok dilli veri kaynaklarıyla da ilgileniyor ve daha önce çok dilli erişim, anahtar kelimeye dayalı yöntemlerde en büyük zorluktu. Rerank 3 modelleri, 100'den fazla dilde güçlü bir çok dilli performans sunarak, İngilizce konuşmayan müşteriler için geri alma sürecini basitleştirir. 

Gelişmiş Kurumsal Arama
MIRACL'de nDCG@10'a dayalı çok dilli erişim doğruluğu (daha yüksek daha iyidir).

Anlamsal arama ve RAG sistemlerinde önemli bir zorluk, veri yığınlama optimizasyonudur. Rerank 3, 4k bağlam penceresiyle bu sorunu gidererek daha büyük belgelerin doğrudan işlenmesine olanak tanır. Bu, alaka puanlaması sırasında bağlamın daha iyi değerlendirilmesine yol açar.

Yeniden Sırala 3 | Gelişmiş Kurumsal Arama

Rerank 3, Elastic'in Çıkarım API'sinde de desteklenir. Elastic search, yaygın olarak benimsenen bir arama teknolojisine sahiptir ve Elasticsearch platformundaki anahtar kelime ve vektör arama yetenekleri, daha büyük ve daha karmaşık kurumsal verileri verimli bir şekilde işlemek için tasarlanmıştır. 

Elasticsearch'ün GVP'si ve Genel Müdürü Matt Riley, "İşletmelerin verilerinin potansiyelini ortaya çıkarmalarına yardımcı olmak için Cohere ile ortaklık kurmaktan heyecan duyuyoruz" dedi. Cohere'in Embed 3 ve Rerank 3 gelişmiş erişim modelleri, karmaşık ve büyük kurumsal veriler üzerinde mükemmel bir performans sunar. Onlar sizin problem çözücünüzdür; bunlar herhangi bir kurumsal arama sisteminin temel bileşenleri haline gelmektedir. 

Daha Uzun Bağlamla Geliştirilmiş Gecikme

E-ticaret veya müşteri hizmetleri gibi birçok iş alanında, düşük gecikme süresi kaliteli bir deneyim sunmak için çok önemlidir. Daha kısa belge uzunlukları için Rerank 3'ye kıyasla 2 kata kadar daha düşük gecikme süresi ve uzun bağlam uzunluklarında 2 kata kadar iyileştirme sağlayan Rerank 3'ü oluştururken bunu akıllarında tuttular.

Yeniden Sırala 3 | Daha Uzun Bağlamla Geliştirilmiş Gecikme
Karşılaştırmalar, çeşitli belge belirteç uzunluğu profillerinde 50 belgenin sıralanması için gereken süre olarak hesaplanır; her çalıştırmada, her belgede aynı belirteç uzunluğuna sahip 50 belgeden oluşan bir grup varsayılır.

Daha İyi Performans ve Verimli RAG

Alma-Artırılmış Üretim (RAG) sistemlerinde, belge alma aşaması genel performans açısından kritik öneme sahiptir. Rerank 3, olağanüstü RAG performansı için iki temel faktörü ele alır: yanıt kalitesi ve gecikme. Model, semantik yeniden sıralama yetenekleri sayesinde kullanıcının sorgusuyla en alakalı belgeleri belirleme konusunda başarılıdır.

Bu hedefli erişim süreci, RAG sisteminin yanıtlarının doğruluğunu doğrudan artırır. Rerank 3, büyük veri kümelerinden ilgili bilgilerin verimli bir şekilde alınmasını sağlayarak, büyük kuruluşların kendi özel verilerinin değerini ortaya çıkarmalarına olanak tanır. Bu, müşteri desteği, hukuk, İK ve finans dahil olmak üzere çeşitli işletme fonksiyonlarını, kullanıcı sorgularına yanıt verecek en ilgili bilgileri sağlayarak kolaylaştırır.

Daha İyi Performans ve Verimli RAG
Rerank 3, Command R model ailesiyle birleştirildiğinde RAG için uygun maliyetli bir çözümdür. Kullanıcıların topraklı oluşturma için LLM'ye daha az belge iletmesine olanak tanıyarak doğruluğu ve gecikmeyi korur. Bu, Rerank'lı RAG'yi diğer üretken LLM'lerden %80-93 daha ucuz hale getirir.

Rerank 3'ün RAG sistemleri için uygun maliyetli Command R ailesiyle entegre edilmesi, kullanıcılar için Toplam Sahip Olma Maliyetinde (TCO) önemli bir azalma sunar. Bu, iki temel faktör aracılığıyla sağlanır. İlk olarak, Rerank 3, LLM'nin temelli yanıt oluşturmak için daha az belge işlemesini gerektirerek son derece alakalı belge seçimini kolaylaştırır. Bu, gecikmeyi en aza indirirken yanıt doğruluğunu korur. İkincisi, Rerank 3 ve Command R modellerinin birleşik verimliliği, piyasadaki alternatif üretken LLM'lere kıyasla %80-93 oranında maliyet azalmasına yol açmaktadır. Aslında hem Rerank 3 hem de Command R'nin maliyet tasarrufları göz önüne alındığında, toplam maliyet düşüşleri %98'i aşabilir.

3'ü yeniden sırala
Bağımsız maliyet, her biri 1 jeton içeren 50 belge ve 250 çıkış jetonu içeren 250 milyon RAG istemine ilişkin çıkarım maliyetlerine dayanmaktadır. Yeniden Sıralamayla Maliyet, her biri 1 jeton olmak üzere 5 belge ve 250 çıkış jetonu içeren 250 milyon RAG istemine ilişkin çıkarım maliyetlerine dayanmaktadır.

RAG sistemleri için giderek yaygınlaşan ve iyi bilinen bir yaklaşım, LLM'leri belge alma süreci için yeniden sıralayıcı olarak kullanmaktır. Rerank 3, sıralama doğruluğu açısından Claude -3 Sonte, GPT Turbo gibi sektör lideri LLM'lerden daha iyi performans gösterirken %90-98 daha ucuzdur. 

3'ü yeniden sırala
Doğruluk, TREC 10 veri kümesinde nDCG@2020'a dayanmaktadır (daha yüksek daha iyidir). Yüksek Lisans'lar RankGPT'de kullanılan yaklaşıma göre liste şeklinde değerlendirilir (Sun ve ark. 2023).

Rerank 3, LLM yanıtının doğruluğunu ve kalitesini artırır. Ayrıca uçtan uca TCO'nun azaltılmasına da yardımcı olur. Rerank bunu, daha az alakalı belgelerimizi ayıklayarak ve yanıtları bulmak için yalnızca ilgili belgelerin küçük alt kümesini sıralayarak başarır.

Sonuç

Rerank 3, kurumsal arama ve RAG sistemleri için devrim niteliğinde bir araçtır. Karmaşık veri yapılarının ve çoklu dillerin işlenmesinde yüksek doğruluk sağlar. Rerank 3, veri yığınını en aza indirerek gecikmeyi ve toplam sahip olma maliyetini azaltır. Bu, daha hızlı arama sonuçları ve uygun maliyetli RAG uygulamalarıyla sonuçlanır. Daha iyi karar verme ve müşteri deneyimleri için Elasticsearch ile entegre olur.

Bunun gibi daha pek çok yapay zeka aracını ve uygulamalarını keşfedebilirsiniz okuyun.

spot_img

En Son İstihbarat

spot_img