Peringkat 3: Meningkatkan Pencarian Perusahaan dan Sistem RAG

Pengantar

Cohere memperkenalkan model dasar generasi berikutnya, Rerank 3 untuk Pencarian Perusahaan yang efisien dan Pengambilan Augmented Generation(LAP). Model Rerank kompatibel dengan semua jenis Database atau indeks pencarian dan juga dapat diintegrasikan ke dalam aplikasi legal apa pun dengan kemampuan pencarian asli. Anda tidak akan membayangkan, bahwa satu baris kode dapat meningkatkan kinerja pencarian atau mengurangi biaya menjalankan sebuah aplikasi RAG dengan dampak yang dapat diabaikan pada latensi.

Mari kita jelajahi bagaimana model dasar ini ditetapkan untuk memajukan sistem pencarian dan RAG perusahaan, dengan akurasi dan efisiensi yang ditingkatkan.

Kemampuan Peringkat Ulang

Rerank menawarkan kemampuan terbaik untuk pencarian perusahaan yang meliputi:

Panjang konteks 4K yang secara signifikan meningkatkan kualitas pencarian untuk dokumen yang lebih panjang.
Itu dapat mencari data multi-aspek dan semi-terstruktur seperti tabel, kode, JSON dokumen, faktur, dan email.
Ini dapat mencakup lebih dari 100 bahasa.
Peningkatan latensi dan penurunan total biaya kepemilikan (TCO)

Model AI generatif dengan konteks yang panjang berpotensi mengeksekusi RAG. Untuk meningkatkan skor akurasi, latensi, dan biaya, solusi RAG harus memerlukan kombinasi pembangkitan Model AI dan tentu saja model Rerank. Pemeringkatan ulang semantik presisi tinggi dari rerank3 memastikan bahwa hanya informasi relevan yang dimasukkan ke model pembangkitan sehingga meningkatkan akurasi respons dan menjaga latensi serta biaya tetap rendah, khususnya saat mengambil informasi dari jutaan dokumen.

Pencarian Perusahaan yang Ditingkatkan

Data perusahaan seringkali sangat kompleks dan sistem saat ini yang ditempatkan di organisasi mengalami kesulitan dalam mencari sumber data multi-aspek dan semi-terstruktur. Secara umum, dalam organisasi, data yang paling berguna tidak dalam format dokumen sederhana seperti JSON yang sangat umum digunakan di aplikasi perusahaan. Rerank 3 dengan mudah dapat memberi peringkat yang kompleks dan multi-aspek seperti email berdasarkan semua bidang metadata yang relevan, termasuk keterkiniannya.

Pemeringkatan ulang 3 secara signifikan meningkatkan seberapa baik ia mengambil kode. Hal ini dapat meningkatkan produktivitas teknisi dengan membantu mereka menemukan cuplikan kode yang tepat dengan lebih cepat, baik dalam basis kode perusahaan atau di seluruh repositori dokumentasi yang luas.

Peringkat ulang 3 | Pencarian Perusahaan yang Ditingkatkan — Akurasi evaluasi kode berdasarkan nDCG@10 di Codesearchnet, Stackoverflow, CosQA, Human Eval, MBPP, DS1000 (lebih tinggi lebih baik).

Raksasa teknologi juga menangani sumber data multibahasa dan pengambilan data multibahasa sebelumnya merupakan tantangan terbesar dalam metode berbasis kata kunci. Model Rerank 3 menawarkan kinerja multibahasa yang kuat dengan lebih dari 100+ bahasa menyederhanakan proses pengambilan untuk pelanggan yang tidak berbahasa Inggris.

Tantangan utama dalam pencarian semantik dan sistem RAG adalah optimasi pengelompokan data. Rerank 3 mengatasi hal ini dengan jendela konteks 4k, memungkinkan pemrosesan langsung dokumen yang lebih besar. Hal ini mengarah pada peningkatan pertimbangan konteks selama penilaian relevansi.

Pemeringkatan ulang 3 juga didukung di API Inferensi Elastic. Pencarian elastis memiliki teknologi pencarian yang diadopsi secara luas dan kemampuan pencarian kata kunci dan vektor di platform Elasticsearch dibangun untuk menangani data perusahaan yang lebih besar dan kompleks secara efisien.

“Kami sangat senang bisa bermitra dengan Cohere untuk membantu bisnis membuka potensi data mereka” kata Matt Riley, GVP dan GM Elasticsearch. Model pengambilan lanjutan Cohere yaitu Embed 3 dan Rerank 3 menawarkan kinerja luar biasa pada data perusahaan yang kompleks dan besar. Mereka adalah pemecah masalah Anda, ini menjadi komponen penting dalam sistem pencarian perusahaan mana pun.

Peningkatan Latensi dengan Konteks yang Lebih Panjang

Di banyak domain bisnis seperti e-niaga atau layanan pelanggan, latensi rendah sangat penting untuk memberikan pengalaman berkualitas. Mereka mengingat hal ini saat membuat Rerank 3, yang menunjukkan latensi hingga 2x lebih rendah dibandingkan dengan Rerank 2 untuk panjang dokumen yang lebih pendek dan peningkatan hingga 3x pada panjang konteks yang panjang.

Performa Lebih Baik dan RAG Efisien

Dalam sistem Retrieval-Augmented Generation (RAG), tahap pengambilan dokumen sangat penting untuk kinerja secara keseluruhan. Pemeringkatan ulang 3 membahas dua faktor penting untuk kinerja RAG yang luar biasa: kualitas respons dan latensi. Model ini unggul dalam menunjukkan dengan tepat dokumen yang paling relevan dengan kueri pengguna melalui kemampuan pemeringkatan semantiknya.

Proses pengambilan yang ditargetkan ini secara langsung meningkatkan keakuratan respons sistem RAG. Dengan memungkinkan pengambilan informasi terkait secara efisien dari kumpulan data besar, Rerank 3 memberdayakan perusahaan besar untuk membuka nilai data milik mereka. Hal ini memfasilitasi berbagai fungsi bisnis, termasuk dukungan pelanggan, hukum, SDM, dan keuangan, dengan memberikan mereka informasi paling relevan untuk menjawab pertanyaan pengguna.

Performa Lebih Baik dan RAG Efisien — Rerank 3 adalah solusi hemat biaya untuk RAG bila dikombinasikan dengan rangkaian model Command R. Hal ini memungkinkan pengguna untuk meneruskan lebih sedikit dokumen ke LLM untuk pembuatan dasar, menjaga akurasi dan latensi. Hal ini membuat RAG dengan Rerank 80-93% lebih murah dibandingkan LLM generatif lainnya.

Mengintegrasikan Rerank 3 dengan keluarga Command R yang hemat biaya untuk sistem RAG menawarkan pengurangan Total Biaya Kepemilikan (TCO) yang signifikan bagi pengguna. Hal ini dicapai melalui dua faktor utama. Pertama, Pemeringkatan Ulang 3 memfasilitasi pemilihan dokumen yang sangat relevan, yang mengharuskan LLM memproses lebih sedikit dokumen untuk menghasilkan respons yang membumi. Hal ini menjaga akurasi respons sekaligus meminimalkan latensi. Kedua, efisiensi gabungan model Rerank 3 dan Command R menghasilkan pengurangan biaya sebesar 80-93% dibandingkan dengan LLM generatif alternatif di pasar. Faktanya, jika mempertimbangkan penghematan biaya dari Rerank 3 dan Command R, total pengurangan biaya bisa melampaui 98%.

Salah satu pendekatan yang semakin umum dan terkenal untuk sistem RAG adalah menggunakan LLM sebagai pemeringkatan ulang untuk proses pengambilan dokumen. Rerank 3 mengungguli LLM terkemuka di industri seperti Claude -3 Sonte, GPT Turbo dalam hal akurasi peringkat dan 90-98% lebih murah.

Rerank 3 meningkatkan akurasi dan kualitas respon LLM. Hal ini juga membantu mengurangi TCO end-to-end. Rerank mencapai hal ini dengan menyingkirkan dokumen-dokumen yang kurang relevan, dan hanya memilah sebagian kecil dokumen yang relevan untuk mendapatkan jawaban.

Kesimpulan

Rerank 3 adalah alat revolusioner untuk pencarian perusahaan dan sistem RAG. Ini memungkinkan akurasi tinggi dalam menangani struktur data yang kompleks dan berbagai bahasa. Pemeringkatan ulang 3 meminimalkan pengelompokan data, mengurangi latensi dan total biaya kepemilikan. Hal ini menghasilkan hasil pencarian yang lebih cepat dan implementasi RAG yang hemat biaya. Ini terintegrasi dengan Elasticsearch untuk meningkatkan pengambilan keputusan dan pengalaman pelanggan.

Anda dapat menjelajahi lebih banyak lagi alat AI dan aplikasinya di sini.

Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
Sumber: https://www.analyticsvidhya.com/blog/2024/04/rerank-3-boosting-enterprise-search-and-rag-systems/

Kecerdasan Data Generatif

Peringkat 3: Meningkatkan Pencarian Perusahaan dan Sistem RAG

Pengantar

Kemampuan Peringkat Ulang

Pencarian Perusahaan yang Ditingkatkan

Peningkatan Latensi dengan Konteks yang Lebih Panjang

Performa Lebih Baik dan RAG Efisien

Kesimpulan

Veed.io: Alat AI Ini Akan Membantu Anda Mengedit Video dengan Mudah

4 Cara Menggunakan Llama 3 [Dijelaskan dengan Langkah-Langkah]

Intelijen Terbaru

Kontrak diberikan untuk memulihkan Hutan Coronet

Bagaimana Komunikasi Jarak Dekat Meningkatkan Pengalaman Ponsel Cerdas Anda

Pemogokan Bandara Brussels South Charleroi dapat dihindari: Manajemen dan mitra sosial mencapai kesepakatan

Apa arti peraturan pembangkit listrik baru Biden bagi utilitas | Bisnis Hijau

Harga kendaraan listrik lama cenderung datar meskipun kemungkinan kembali ke norma musiman untuk mobil bekas

Platinum Web Marketing, Perusahaan Pemasaran Internet Berbasis Henderson, Menerima Empat Penghargaan Industri Terkemuka Pada Tahun 2024