제퍼넷 로고

태그: 아파치 하이브

Amazon S3, AWS Glue 및 Snowflake를 통해 데이터 레이크에서 Apache Iceberg 사용 | 아마존 웹 서비스

이 게시물은 Snowflake의 Andries Engelbrecht 및 Scott Teal과 공동으로 작성되었습니다. 기업은 끊임없이 발전하고 있으며...

톱 뉴스

AWS Lake Formation 2023년 검토 | 아마존 웹 서비스

AWS Lake Formation 및 AWS Glue 데이터 카탈로그는 Amazon에 구축된 데이터 레이크를 위한 데이터 거버넌스 솔루션의 핵심 부분을 구성합니다.

AWS Lake Formation과 통합된 Amazon EMR을 통해 오픈 테이블 형식에 대한 세분화된 액세스 제어를 시행 | 아마존 웹 서비스

Amazon EMR 6.15를 통해 우리는 Apache Hudi, Apache Iceberg 등 OTF(Open Table Format)에 대한 FGAC(Fine-grained Access Control) 기반 AWS Lake Formation을 출시했습니다.

GoDaddy 벤치마킹 결과 Amazon EMR 서버리스에서 AWS Graviton24를 사용하여 Spark 워크로드의 가격 대비 성능이 최대 2% 향상되었습니다 | 아마존 웹 서비스

이 게시물은 소프트웨어 개발 엔지니어인 Mukul Sharma와 GoDaddy의 엔지니어링 이사인 Ozcan IIikhan이 공동으로 작성한 게스트 게시물입니다. GoDaddy는 일상적인 기업가에게 힘을 실어줍니다...

AWS 단계 함수를 사용하여 Amazon EMR 서버리스 작업 조율 | 아마존 웹 서비스

Amazon EMR 서버리스는 Apache Spark와 같은 최신 오픈 소스 프레임워크를 사용하는 분석 애플리케이션의 운영을 단순화하는 서버리스 런타임 환경을 제공합니다.

EC2 클러스터의 Amazon EMR에 대한 용량 관리 및 Amazon EMR Managed Scaling 개선 | 아마존 웹 서비스

2022년에는 Amazon EMR Managed Scaling의 새로운 개선 사항에 대해 말씀드렸습니다. 이는 클러스터 활용도를 향상하는 데 도움이 되었습니다.

Ontraport가 AWS Glue를 사용하여 데이터 처리 비용을 80% 절감한 방법 | 아마존 웹 서비스

이 게시물은 Ontraport의 Elijah Ball과 공동으로 작성되었습니다. 고객은 AWS 클라우드에서 데이터 및 분석 워크로드를 구현하여...

AWS Lake Formation 권한으로 Apache Hive 메타스토어 쿼리 | 아마존 웹 서비스

Apache Hive는 Apache Hadoop 플랫폼에서 고도로 분산된 데이터 세트를 처리하기 위한 SQL 기반 데이터 웨어하우스 시스템입니다. 두 가지 주요 구성 요소가 있습니다...

Zoom이 Amazon EMR에서 Apache Hudi를 사용하여 스트리밍 로그 수집 및 효율적인 GDPR 삭제를 구현한 방법 | 아마존 웹 서비스

오늘날의 디지털 시대에 로깅은 애플리케이션 개발 및 관리의 중요한 측면이지만 데이터 보호 규정을 준수하면서 로그를 효율적으로 관리하는...

Amazon Athena를 사용하여 Apache Iceberg 테이블과 상호 작용하고 AWS Lake Formation을 사용하여 계정 간 세분화된 권한 사용

우리는 최근 지원되는 모든 파일 형식으로 저장된 데이터에 대한 Amazon Athena 쿼리에서 AWS Lake Formation 세분화된 액세스 제어 정책에 대한 지원을 발표했습니다...

Amazon SageMaker Data Wrangler와 Apache Hive의 기능으로 통찰력 확보 시간 단축

Amazon SageMaker Data Wrangler는 Amazon에서 기계 학습(ML)용 데이터를 집계하고 준비하는 데 걸리는 시간을 몇 주에서 몇 분으로 단축합니다...

Apache Flume 살펴보기: 설치, 설정 및 구성

소개 Apache Flume은 로그 파일과 같은 다양한 소스에서 엄청난 양의 스트리밍 데이터를 수집, 집계 및 전달하기 위한 도구/서비스/데이터 수집 메커니즘입니다.

20년 전문가가 사용하는 상위 2023개 빅 데이터 도구

소개 빅 데이터는 다양한 소스에서 생성되고 기하급수적으로 증가하는 크고 복잡한 데이터 세트입니다. 너무 방대하고 다양해서 전통적인 데이터는 ...

최신 인텔리전스

spot_img
spot_img