Zephyrnet Logo

Quatro novos recursos do Apache Cassandra 5.0 para se entusiasmar – DATAVERSITY

Data:

Com a recente versão beta do Apache Cassandra 5.0, agora é um ótimo momento para as equipes experimentarem e descobrirem os novos recursos mais interessantes e esperados do 5.0. 

Enquanto dei uma olhada no novo beta, aqui estão quatro recursos introduzidos no Cassandra 5.0 de código aberto que devem deixar as equipes de desenvolvedores entusiasmadas:

1. Suporte vetorial: introdução à pesquisa vetorial, novas funções e um novo tipo de dados vetoriais

Cassandra 5.0 adiciona Pesquisa de vetores, um novo recurso particularmente poderoso para encontrar conteúdo relevante em grandes conjuntos de dados, juntamente com novas funções CQL e um novo tipo de dados vetoriais que salva e recupera vetores de incorporação. É importante para muitos que esses novos recursos tornem o Cassandra 5.0 uma tecnologia de camada de dados ideal para equipes que buscam projetos de IA/ML – fornecendo a funcionalidade específica que esses projetos exigem, juntamente com os benefícios existentes de alta disponibilidade, escalabilidade e código aberto do Cassandra. 

Para modelos de ML, realizar comparações de similaridade é fundamental para compreender os dados e as conexões de dados no contexto. Por exemplo, aplicações de IA, desde mecanismos de recomendação de produtos até IA generativa os chatbots operam reconhecendo padrões e extrapolando a tomada de decisões com base na semelhança de novas entradas de dados e consultas com dados de treinamento existentes. Ser capaz de armazenar vetores de incorporação – matrizes de números de ponto flutuante que comunicam o quão semelhantes objetos ou entidades específicas são entre si – é fundamental para permitir essas comparações de similaridade cruciais. Portanto, Cassandra 5.0 é agora uma solução ideal para o desenvolvimento de aplicações de IA.

2. Indexação anexada ao armazenamento

O novo Storage-Attached Indexing (SAI) do Cassandra 5.0 otimiza o ciclo de vida dos índices secundários, ao mesmo tempo que os torna armazenamentos mais eficientes e mais fáceis de usar. O SAI permite que os usuários do Cassandra criem um ou mais índices secundários em uma tabela de banco de dados, com cada índice baseado em uma única coluna de escolha do usuário.

Essa indexação em nível de coluna, altamente escalável e distribuída globalmente, oferece uma taxa de transferência de E/S incomparável para pesquisa, incluindo pesquisa vetorial. O SAI também apresenta extensibilidade modular, com o Vector Search servindo como uma demonstração inicial dessa capacidade. Os índices SAI podem capturar a semântica indexando consultas e conteúdo (incluindo entradas grandes, como documentos e imagens) para obter uma funcionalidade de indexação excepcional.

3. Experimente Memtables e SSTables Trie-Indexados

Os usuários do Cassandra 5.0 podem aproveitar potenciais melhorias significativas de desempenho e otimização de memória que vêm com os novos Memtables e SSTables baseados em trie (árvore de prefixo) desta versão. Embora o Cassandra seja mais conhecido por sua arquitetura distribuída, esses formatos de armazenamento utilizam tentativas e representações comparáveis ​​em bytes de chaves de banco de dados para melhorar o desempenho do Cassandra para operações de leitura e modificação, bem como para dimensionar corretamente as estruturas dos dados. Trie Memtables e Trie-Indexed SSTables também reduzem a carga de sobrecarga de gerenciamento de memória e coleta de lixo, tornando mais simples para organizações de grande escala gerenciar seus dados.

Resumindo: esses recursos para reduzir a sobrecarga de armazenamento – ao mesmo tempo que melhoram a escalabilidade e o desempenho de gravação e leitura – atrairão a atenção e a apreciação dos usuários do Cassandra. 

4. Novas funções matemáticas e de agregação

Cassandra 5.0 adiciona novas funções CQL nativas e a capacidade dos usuários criarem suas próprias funções definidas pelo usuário. Essas adições servem para expandir a velocidade e a flexibilidade com que os usuários podem atingir seus objetivos com o Cassandra.

As novas funções de agregação nativa incluem:

  • contagem – Descubra quantos itens existem em uma coleção
  • max e min – Encontre o máximo ou mínimo de itens de uma coleção
  • soma e média – Encontre a soma ou média dos itens em uma coleção numérica

Novas funções nativas para operar em colunas de coleção incluem:

  • map_keys – Obtenha as chaves de um mapa
  • map_values ​​– Obtenha os valores de um mapa

Novas funções matemáticas nativas incluem:

  • abs – Retorna o valor absoluto de x
  • exp – Retorna o valor de e (a base dos logaritmos naturais) à potência da entrada
  • log – Retorna o logaritmo natural (base e) da entrada
  • log10 – Retorna o logaritmo de base 10 da entrada
  • round – Retorna o número inteiro mais próximo da entrada

Dê uma chance

Os interessados ​​em aproveitar as vantagens do Cassandra 5.0 destacadas aqui devem experimentá-lo por si mesmos e ficar à frente da curva quando se trata de utilizar e otimizar o Cassandra totalmente de código aberto.

local_img

Inteligência mais recente

local_img