Zephyrnet Logosu

Heyecan Verici Dört Yeni Apache Cassandra 5.0 Özelliği – DATAVERSITY

Tarih:

Son zamanlarda beta sürümü Apache Cassandra 5.0'ın yeni sürümüyle birlikte ekiplerin bir deneme yapması ve 5.0'ın en ilginç ve beklenen yeni yeteneklerini keşfetmesi için şimdi harika bir zaman. 

Yeni betayı araştırırken, açık kaynak Cassandra 5.0 ile sunulan ve geliştirici ekipleri heyecanlandırması gereken dört özelliği burada bulabilirsiniz:

1. Vektör Desteği: Vektör Arama, Yeni İşlevler ve Yeni Vektör Veri Türüyle Tanışın

Cassandra 5.0 ekler Vektör Arama, büyük veri kümeleri içinde ilgili içeriği bulmaya yönelik özellikle güçlü yeni bir özellik, yeni CQL işlevleri ve gömme vektörlerini kaydeden ve geri getiren yeni bir vektör veri türü. Çoğu kişi için önemli olan bu yeni özellikler, Cassandra 5.0'ı AI/ML projelerini takip eden ekipler için ideal bir veri katmanı teknolojisi haline getiriyor; Cassandra'nın mevcut yüksek kullanılabilirlik, ölçeklenebilirlik ve açık kaynak avantajlarının yanı sıra bu projelerin ihtiyaç duyduğu belirli işlevleri sağlıyor. 

ML modelleri için benzerlik karşılaştırmaları yapmak, verileri ve veri bağlantılarını bağlamda anlamak açısından kritik öneme sahiptir. Örneğin, ürün öneri motorlarından yapay zeka uygulamalarına üretken yapay zeka Sohbet robotları, kalıpları tanıyarak ve yeni veri girişlerinin ve sorgularının mevcut eğitim verileriyle benzerliğine dayalı olarak karar verme sürecini tahmin ederek çalışır. Gömme vektörlerini (belirli nesnelerin veya varlıkların birbirine ne kadar benzer olduğunu ileten kayan nokta sayıları dizileri) depolayabilmek, bu önemli benzerlik karşılaştırmalarını mümkün kılmanın anahtarıdır. Bu nedenle Cassandra 5.0 artık yapay zeka uygulama geliştirme için tercih edilen bir çözümdür.

2. Depolamaya Bağlı Dizin Oluşturma

Cassandra 5.0'ın yeni Depolamaya Bağlı Dizin Oluşturma (SAI), ikincil dizinlerin yaşam döngüsünü optimize ederken aynı zamanda onları daha verimli depolar ve kullanımlarını kolaylaştırır. SAI, Cassandra kullanıcılarının, her bir indeksin kullanıcının tercih ettiği tek bir sütunu temel aldığı bir veritabanı tablosu üzerinde bir veya daha fazla ikincil indeks oluşturmasına olanak tanır.

Bu son derece ölçeklenebilir, global olarak dağıtılmış sütun düzeyinde indeksleme, Vektör Arama da dahil olmak üzere arama için eşsiz I/O verimi sunar. SAI aynı zamanda modüler genişletilebilirliğe de sahiptir ve Vektör Arama bu yeteneğin ilk gösterimidir. SAI indeksleri, olağanüstü indeksleme işlevselliği elde etmek için hem sorguları hem de içeriği (belgeler ve resimler gibi büyük girdiler dahil) indeksleyerek anlambilimi yakalayabilir.

3. Trie Memtable'lar ve Trie-indeksli SSTable'lar

Cassandra 5.0 kullanıcıları, bu sürümün yeni trie (önek ağacı) tabanlı Memtable'ları ve SSTable'ları ile birlikte gelen önemli potansiyel performans iyileştirmelerinden ve bellek optimizasyonundan yararlanabilirler. Cassandra en çok dağıtılmış mimarisiyle bilinmesine rağmen, bu depolama formatları veri yapılarının doğru şekilde boyutlandırılmasının yanı sıra okuma ve değişiklik işlemleri için Cassandra'nın performansını artırmak amacıyla veritabanı anahtarlarının denemelerini ve baytlarla karşılaştırılabilir temsillerini kullanır. Trie Memtable'lar ve Trie-Indexed SSTable'lar aynı zamanda bellek yönetimi ve çöp toplama yükünü de azaltarak, yüksek ölçekli kuruluşların verilerini yönetmesini kolaylaştırır.

Sonuç olarak: ölçeklenebilirliği ve yazma ve okuma performansını geliştirirken depolama yükünü azaltmaya yönelik bu özellikler, Cassandra kullanıcılarının dikkatini ve takdirini kazanacaktır. 

4. Yeni Toplama ve Matematik Fonksiyonları

Cassandra 5.0, yeni yerel CQL işlevleri ve kullanıcıların kendi yeni kullanıcı tanımlı işlevlerini oluşturma yeteneğini ekler. Bu eklemeler, kullanıcıların Cassandra ile hedeflerine ulaşma hızını ve esnekliğini artırmaya hizmet ediyor.

Yeni yerel toplama işlevleri şunları içerir:

  • count – Bir koleksiyonda kaç öğe olduğunu bulun
  • max ve min – Bir koleksiyonun maksimum veya minimum öğelerini bulun
  • sum ve avg – Sayısal bir koleksiyondaki öğelerin toplamını veya ortalamasını bulun

Koleksiyon sütunlarında çalışmaya yönelik yeni yerel işlevler şunları içerir:

  • Map_keys – Bir haritanın anahtarlarını alır
  • Map_values ​​– Bir haritanın değerlerini alır

Yeni yerel matematik işlevleri şunları içerir:

  • abs – x'in mutlak değerini döndürür
  • exp – e'nin değerini (doğal logaritmanın tabanı) girdinin kuvvetine göre döndürür
  • log – Girişin doğal logaritmasını (e tabanı) döndürür
  • log10 – Girişin 10 tabanındaki logaritmasını döndürür
  • round – Girdiye en yakın tamsayıyı döndürür

Bir Deneyin

Cassandra 5.0'ın burada vurgulanan avantajlarından yararlanmak isteyenler bunu kendileri denemeli ve tamamen açık kaynaklı Cassandra'yı kullanma ve optimize etme konusunda diğerlerinden bir adım öne geçmelidir.

spot_img

En Son İstihbarat

spot_img