Logo Zephyrnet

Peringkat 3: Meningkatkan Pencarian Perusahaan dan Sistem RAG

Tanggal:

Pengantar

Cohere memperkenalkan model dasar generasi berikutnya, Rerank 3 untuk Pencarian Perusahaan yang efisien dan Pengambilan Augmented Generation(LAP). Model Rerank kompatibel dengan semua jenis Database atau indeks pencarian dan juga dapat diintegrasikan ke dalam aplikasi legal apa pun dengan kemampuan pencarian asli. Anda tidak akan membayangkan, bahwa satu baris kode dapat meningkatkan kinerja pencarian atau mengurangi biaya menjalankan sebuah aplikasi RAG dengan dampak yang dapat diabaikan pada latensi.  

Mari kita jelajahi bagaimana model dasar ini ditetapkan untuk memajukan sistem pencarian dan RAG perusahaan, dengan akurasi dan efisiensi yang ditingkatkan. 

Peringkat ulang 3

Kemampuan Peringkat Ulang 

Rerank menawarkan kemampuan terbaik untuk pencarian perusahaan yang meliputi: 

  • Panjang konteks 4K yang secara signifikan meningkatkan kualitas pencarian untuk dokumen yang lebih panjang. 
  • Itu dapat mencari data multi-aspek dan semi-terstruktur seperti tabel, kode, JSON dokumen, faktur, dan email. 
  • Ini dapat mencakup lebih dari 100 bahasa.
  • Peningkatan latensi dan penurunan total biaya kepemilikan (TCO)

Model AI generatif dengan konteks yang panjang berpotensi mengeksekusi RAG. Untuk meningkatkan skor akurasi, latensi, dan biaya, solusi RAG harus memerlukan kombinasi pembangkitan Model AI dan tentu saja model Rerank. Pemeringkatan ulang semantik presisi tinggi dari rerank3 memastikan bahwa hanya informasi relevan yang dimasukkan ke model pembangkitan sehingga meningkatkan akurasi respons dan menjaga latensi serta biaya tetap rendah, khususnya saat mengambil informasi dari jutaan dokumen. 

Data perusahaan seringkali sangat kompleks dan sistem saat ini yang ditempatkan di organisasi mengalami kesulitan dalam mencari sumber data multi-aspek dan semi-terstruktur. Secara umum, dalam organisasi, data yang paling berguna tidak dalam format dokumen sederhana seperti JSON yang sangat umum digunakan di aplikasi perusahaan. Rerank 3 dengan mudah dapat memberi peringkat yang kompleks dan multi-aspek seperti email berdasarkan semua bidang metadata yang relevan, termasuk keterkiniannya. 

Pencarian Perusahaan yang Ditingkatkan
Akurasi pengambilan multibahasa berdasarkan nDCG@10 pada MIRACL (lebih tinggi lebih baik).

Pemeringkatan ulang 3 secara signifikan meningkatkan seberapa baik ia mengambil kode. Hal ini dapat meningkatkan produktivitas teknisi dengan membantu mereka menemukan cuplikan kode yang tepat dengan lebih cepat, baik dalam basis kode perusahaan atau di seluruh repositori dokumentasi yang luas.

Peringkat ulang 3 | Pencarian Perusahaan yang Ditingkatkan
Akurasi evaluasi kode berdasarkan nDCG@10 di Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS1000 (lebih tinggi lebih baik).

Raksasa teknologi juga menangani sumber data multibahasa dan pengambilan data multibahasa sebelumnya merupakan tantangan terbesar dalam metode berbasis kata kunci. Model Rerank 3 menawarkan kinerja multibahasa yang kuat dengan lebih dari 100+ bahasa menyederhanakan proses pengambilan untuk pelanggan yang tidak berbahasa Inggris. 

Pencarian Perusahaan yang Ditingkatkan
Akurasi pengambilan multibahasa berdasarkan nDCG@10 pada MIRACL (lebih tinggi lebih baik).

Tantangan utama dalam pencarian semantik dan sistem RAG adalah optimasi pengelompokan data. Rerank 3 mengatasi hal ini dengan jendela konteks 4k, memungkinkan pemrosesan langsung dokumen yang lebih besar. Hal ini mengarah pada peningkatan pertimbangan konteks selama penilaian relevansi.

Peringkat ulang 3 | Pencarian Perusahaan yang Ditingkatkan

Pemeringkatan ulang 3 juga didukung di API Inferensi Elastic. Pencarian elastis memiliki teknologi pencarian yang diadopsi secara luas dan kemampuan pencarian kata kunci dan vektor di platform Elasticsearch dibangun untuk menangani data perusahaan yang lebih besar dan kompleks secara efisien. 

“Kami sangat senang bisa bermitra dengan Cohere untuk membantu bisnis membuka potensi data mereka” kata Matt Riley, GVP dan GM Elasticsearch. Model pengambilan lanjutan Cohere yaitu Embed 3 dan Rerank 3 menawarkan kinerja luar biasa pada data perusahaan yang kompleks dan besar. Mereka adalah pemecah masalah Anda, ini menjadi komponen penting dalam sistem pencarian perusahaan mana pun. 

Peningkatan Latensi dengan Konteks yang Lebih Panjang

Di banyak domain bisnis seperti e-niaga atau layanan pelanggan, latensi rendah sangat penting untuk memberikan pengalaman berkualitas. Mereka mengingat hal ini saat membuat Rerank 3, yang menunjukkan latensi hingga 2x lebih rendah dibandingkan dengan Rerank 2 untuk panjang dokumen yang lebih pendek dan peningkatan hingga 3x pada panjang konteks yang panjang.

Peringkat ulang 3 | Peningkatan Latensi dengan Konteks yang Lebih Panjang
Perbandingan dihitung sebagai waktu untuk menentukan peringkat 50 dokumen di berbagai profil panjang token dokumen; setiap proses mengasumsikan kumpulan 50 dokumen dengan panjang token seragam di setiap dokumen.

Performa Lebih Baik dan RAG Efisien

Dalam sistem Retrieval-Augmented Generation (RAG), tahap pengambilan dokumen sangat penting untuk kinerja secara keseluruhan. Pemeringkatan ulang 3 membahas dua faktor penting untuk kinerja RAG yang luar biasa: kualitas respons dan latensi. Model ini unggul dalam menunjukkan dengan tepat dokumen yang paling relevan dengan kueri pengguna melalui kemampuan pemeringkatan semantiknya.

Proses pengambilan yang ditargetkan ini secara langsung meningkatkan keakuratan respons sistem RAG. Dengan memungkinkan pengambilan informasi terkait secara efisien dari kumpulan data besar, Rerank 3 memberdayakan perusahaan besar untuk membuka nilai data milik mereka. Hal ini memfasilitasi berbagai fungsi bisnis, termasuk dukungan pelanggan, hukum, SDM, dan keuangan, dengan memberikan mereka informasi paling relevan untuk menjawab pertanyaan pengguna.

Performa Lebih Baik dan RAG Efisien
Rerank 3 adalah solusi hemat biaya untuk RAG bila dikombinasikan dengan rangkaian model Command R. Hal ini memungkinkan pengguna untuk meneruskan lebih sedikit dokumen ke LLM untuk pembuatan dasar, menjaga akurasi dan latensi. Hal ini membuat RAG dengan Rerank 80-93% lebih murah dibandingkan LLM generatif lainnya.

Mengintegrasikan Rerank 3 dengan keluarga Command R yang hemat biaya untuk sistem RAG menawarkan pengurangan Total Biaya Kepemilikan (TCO) yang signifikan bagi pengguna. Hal ini dicapai melalui dua faktor utama. Pertama, Pemeringkatan Ulang 3 memfasilitasi pemilihan dokumen yang sangat relevan, yang mengharuskan LLM memproses lebih sedikit dokumen untuk menghasilkan respons yang membumi. Hal ini menjaga akurasi respons sekaligus meminimalkan latensi. Kedua, efisiensi gabungan model Rerank 3 dan Command R menghasilkan pengurangan biaya sebesar 80-93% dibandingkan dengan LLM generatif alternatif di pasar. Faktanya, jika mempertimbangkan penghematan biaya dari Rerank 3 dan Command R, total pengurangan biaya bisa melampaui 98%.

Peringkat ulang 3
Biaya mandiri didasarkan pada biaya inferensi untuk 1 juta permintaan RAG dengan 50 dokumen yang masing-masing berisi 250 token, dan 250 token keluaran. Biaya dengan Rerank didasarkan pada biaya inferensi untuk 1 juta permintaan RAG dengan 5 dokumen @ 250 token masing-masing, dan 250 token keluaran.

Salah satu pendekatan yang semakin umum dan terkenal untuk sistem RAG adalah menggunakan LLM sebagai pemeringkatan ulang untuk proses pengambilan dokumen. Rerank 3 mengungguli LLM terkemuka di industri seperti Claude -3 Sonte, GPT Turbo dalam hal akurasi peringkat dan 90-98% lebih murah. 

Peringkat ulang 3
Akurasi berdasarkan nDCG@10 pada dataset TREC 2020 (semakin tinggi semakin baik). LLM dievaluasi berdasarkan daftar mengikuti pendekatan yang digunakan dalam RankGPT (Sun et al. 2023).

Rerank 3 meningkatkan akurasi dan kualitas respon LLM. Hal ini juga membantu mengurangi TCO end-to-end. Rerank mencapai hal ini dengan menyingkirkan dokumen-dokumen yang kurang relevan, dan hanya memilah sebagian kecil dokumen yang relevan untuk mendapatkan jawaban.

Kesimpulan

Rerank 3 adalah alat revolusioner untuk pencarian perusahaan dan sistem RAG. Ini memungkinkan akurasi tinggi dalam menangani struktur data yang kompleks dan berbagai bahasa. Pemeringkatan ulang 3 meminimalkan pengelompokan data, mengurangi latensi dan total biaya kepemilikan. Hal ini menghasilkan hasil pencarian yang lebih cepat dan implementasi RAG yang hemat biaya. Ini terintegrasi dengan Elasticsearch untuk meningkatkan pengambilan keputusan dan pengalaman pelanggan.

Anda dapat menjelajahi lebih banyak lagi alat AI dan aplikasinya di sini.

tempat_img

Intelijen Terbaru

tempat_img