제퍼넷 로고

기대되는 5.0가지 새로운 Apache Cassandra XNUMX 기능 – DATAVERSITY

시간

최근의 베타 출시 이제 Apache Cassandra 5.0을 시험해보고 5.0의 가장 흥미롭고 기대되는 새로운 기능을 발견할 수 있는 좋은 시간입니다. 

새로운 베타에 대해 살펴보았을 때 개발자 팀이 기대해야 할 오픈 소스 Cassandra 5.0에 도입된 네 가지 기능은 다음과 같습니다.

1. 벡터 지원: 벡터 검색, 새로운 기능 및 새로운 벡터 데이터 유형 소개

카산드라 5.0 추가 벡터 검색는 새로운 CQL 함수와 임베딩 벡터를 저장하고 검색하는 새로운 벡터 데이터 유형과 함께 대규모 데이터세트 내에서 관련 콘텐츠를 찾는 데 특히 강력한 새 기능입니다. 많은 사람들에게 중요한 점은 이러한 새로운 기능을 통해 Cassandra 5.0이 AI/ML 프로젝트를 추구하는 팀에 이상적인 데이터 계층 기술이 되어 Cassandra의 기존 고가용성, 확장성 및 오픈 소스 이점과 함께 해당 프로젝트에 필요한 특정 기능을 제공한다는 것입니다. 

ML 모델의 경우 유사성 비교를 수행하는 것은 상황에 맞는 데이터와 데이터 연결을 이해하는 데 중요합니다. 예를 들어, 상품 추천 엔진부터 AI 애플리케이션까지 생성 적 AI 챗봇은 패턴을 인식하고 새로운 데이터 입력 및 기존 교육 데이터에 대한 쿼리의 유사성을 기반으로 의사결정을 추론하는 방식으로 작동합니다. 임베딩 벡터(특정 객체나 엔터티가 서로 얼마나 유사한지를 전달하는 부동 소수점 숫자 배열)를 저장할 수 있는 능력은 중요한 유사성 비교를 가능하게 하는 핵심입니다. 따라서 Cassandra 5.0은 이제 AI 애플리케이션 개발을 위한 솔루션입니다.

2. 저장소 연결 인덱싱

Cassandra 5.0의 새로운 SAI(Storage-Attached Indexing)는 보조 인덱스의 수명 주기를 최적화하는 동시에 이를 더욱 효율적으로 저장하고 사용하기 쉽게 만듭니다. SAI를 사용하면 Cassandra 사용자는 데이터베이스 테이블에 하나 이상의 보조 인덱스를 생성할 수 있으며 각 인덱스는 사용자가 선택한 단일 열을 기반으로 합니다.

확장성이 뛰어나고 전역적으로 분산된 이 열 수준 인덱싱은 벡터 검색을 포함하여 검색에 대해 비교할 수 없는 I/O 처리량을 제공합니다. SAI는 또한 이 기능의 초기 데모 역할을 하는 벡터 검색을 통해 모듈식 확장성을 제공합니다. SAI 인덱스는 쿼리와 콘텐츠(문서 및 이미지와 같은 대규모 입력 포함)를 모두 인덱싱하여 의미 체계를 캡처하여 뛰어난 인덱싱 기능을 달성할 수 있습니다.

3. Trie Memtable과 Trie-Indexed SSTable

Cassandra 5.0 사용자는 이 버전의 새로운 trie(접두사 트리) 기반 Memtable 및 SSTable과 함께 제공되는 상당한 잠재적 성능 개선 및 메모리 최적화를 활용할 수 있습니다. Cassandra는 분산 아키텍처로 가장 잘 알려져 있지만 이러한 스토리지 형식은 데이터베이스 키의 시도 및 바이트 비교 가능한 표현을 활용하여 읽기 및 수정 작업에 대한 Cassandra의 성능을 향상시키고 데이터 구조의 크기를 올바르게 조정합니다. 또한 Trie Memtables 및 Trie-Indexed SSTables는 메모리 관리 오버헤드 및 가비지 수집 부담을 줄여 대규모 조직의 데이터 관리를 더 간단하게 만듭니다.

결론: 확장성과 쓰기 및 읽기 성능을 향상시키면서 스토리지 오버헤드를 줄이는 이러한 기능은 Cassandra 사용자의 관심과 감사를 얻을 것입니다. 

4. 새로운 집계 및 수학 함수

Cassandra 5.0에는 새로운 기본 CQL 함수와 사용자가 자신만의 새로운 사용자 정의 함수를 구축할 수 있는 기능이 추가되었습니다. 이러한 추가 기능은 사용자가 Cassandra를 사용하여 목표를 달성할 수 있는 속도와 유연성을 확장하는 데 도움이 됩니다.

새로운 기본 집계 함수는 다음과 같습니다.

  • count – 컬렉션에 몇 개의 항목이 있는지 확인
  • max 및 min – 컬렉션의 최대 또는 최소 항목 찾기
  • 합계 및 평균 – 숫자 컬렉션에 있는 항목의 합계 또는 평균을 찾습니다.

컬렉션 열에 대한 작업을 위한 새로운 기본 함수는 다음과 같습니다.

  • map_keys – 지도의 키를 가져옵니다.
  • map_values ​​- 맵의 값을 가져옵니다.

새로운 기본 수학 함수는 다음과 같습니다.

  • abs - x의 절대값을 반환합니다.
  • exp – e(자연 로그의 밑) 값을 입력의 거듭제곱으로 반환합니다.
  • log – 입력의 자연 로그(밑 e)를 반환합니다.
  • log10 – 입력의 밑이 10인 로그를 반환합니다.
  • round – 입력에 가장 가까운 정수를 반환합니다.

한번 해보세요

여기에 강조된 Cassandra 5.0의 장점을 활용하는 데 관심이 있는 사람들은 직접 사용해 보고 완전 오픈 소스 Cassandra를 활용하고 최적화하는 데 있어 앞서 나가야 합니다.

spot_img

최신 인텔리전스

spot_img