Logo Zephyrnet

Nhãn: tổ ong apache

Sử dụng Apache Iceberg trong hồ dữ liệu của bạn với Amazon S3, AWS Glue và Snowflake | Dịch vụ web của Amazon

Bài đăng này được đồng viết với Andries Engelbrecht và Scott Teal từ Snowflake. Các doanh nghiệp không ngừng phát triển và...

Tin tức hàng đầu

Đánh giá năm 2023 của AWS Lake Formation | Dịch vụ web của Amazon

AWS Lake Formation và Danh mục dữ liệu AWS Glue là một phần không thể thiếu trong giải pháp quản trị dữ liệu dành cho các hồ dữ liệu được xây dựng trên Amazon...

Thực thi kiểm soát truy cập chi tiết trên Định dạng bảng mở thông qua Amazon EMR được tích hợp với AWS Lake Formation | Dịch vụ web của Amazon

Với Amazon EMR 6.15, chúng tôi đã triển khai các biện pháp kiểm soát truy cập chi tiết (FGAC) dựa trên AWS Lake Formation trên Định dạng bảng mở (OTF), bao gồm Apache Hudi, Apache Iceberg,...

Điểm chuẩn của GoDaddy mang lại hiệu suất giá tốt hơn tới 24% cho khối lượng công việc Spark của họ với AWS Graviton2 trên Amazon EMR Serverless | Dịch vụ web của Amazon

Đây là bài đăng của khách được đồng sáng tác với Mukul Sharma, Kỹ sư phát triển phần mềm và Ozcan IIikhan, Giám đốc kỹ thuật của GoDaddy. GoDaddy trao quyền cho các doanh nhân hàng ngày...

Điều phối các công việc Amazon EMR Serverless bằng chức năng AWS Step | Dịch vụ web của Amazon

Amazon EMR Serverless cung cấp môi trường thời gian chạy serverless giúp đơn giản hóa hoạt động của các ứng dụng phân tích sử dụng khung nguồn mở mới nhất, chẳng hạn như Apache Spark...

Các cải tiến về Quản lý năng lực và Quy mô được quản lý của Amazon EMR cho Amazon EMR trên cụm EC2 | Dịch vụ web của Amazon

Vào năm 2022, chúng tôi đã thông báo cho bạn về những cải tiến mới mà chúng tôi đã thực hiện trong Amazon EMR Managed Scaling, giúp cải thiện việc sử dụng cụm cũng như...

Cách Ontraport giảm 80% chi phí xử lý dữ liệu bằng AWS Glue | Dịch vụ web của Amazon

Bài đăng này được viết với sự cộng tác của Elijah Ball từ Ontraport. Khách hàng đang triển khai khối lượng công việc dữ liệu và phân tích trong Đám mây AWS để tối ưu hóa...

Truy vấn kho lưu trữ di động Apache Hive của bạn với quyền AWS Lake Formation | Dịch vụ web của Amazon

Apache Hive là một hệ thống kho dữ liệu dựa trên SQL để xử lý các bộ dữ liệu phân tán cao trên nền tảng Apache Hadoop. Có hai thành phần chính để...

Cách Zoom triển khai tính năng nhập nhật ký phát trực tuyến và xóa GDPR hiệu quả bằng cách sử dụng Apache Hudi trên Amazon EMR | Dịch vụ web của Amazon

Trong thời đại kỹ thuật số ngày nay, ghi nhật ký là một khía cạnh quan trọng của việc phát triển và quản lý ứng dụng, nhưng việc quản lý nhật ký hiệu quả đồng thời tuân thủ các quy định bảo vệ dữ liệu...

Tương tác với các bảng Apache Iceberg bằng Amazon Athena và cấp quyền chi tiết cho nhiều tài khoản bằng AWS Lake Formation

Gần đây, chúng tôi đã công bố hỗ trợ cho các chính sách kiểm soát truy cập chi tiết của AWS Lake Formation trong truy vấn Amazon Athena đối với dữ liệu được lưu trữ ở bất kỳ định dạng tệp được hỗ trợ nào...

Tăng tốc thời gian để hiểu rõ hơn với Amazon SageMaker Data Wrangler và sức mạnh của Apache Hive

Amazon SageMaker Data Wrangler giảm thời gian tổng hợp và chuẩn bị dữ liệu cho machine learning (ML) từ vài tuần xuống còn vài phút ở Amazon...

Đi sâu vào Apache Flume: Cài đặt, Thiết lập và Cấu hình

Giới thiệu Apache Flume là một công cụ/dịch vụ/cơ chế nhập dữ liệu để thu thập, tổng hợp và phân phối lượng dữ liệu truyền trực tuyến khổng lồ từ nhiều nguồn khác nhau, chẳng hạn như tệp nhật ký,...

20 công cụ dữ liệu lớn hàng đầu được các chuyên gia sử dụng vào năm 2023

Giới thiệu Dữ liệu lớn là một tập dữ liệu lớn và phức tạp được tạo bởi nhiều nguồn khác nhau và phát triển theo cấp số nhân. Nó rộng lớn và đa dạng đến mức dữ liệu truyền thống...

Tin tức mới nhất

tại chỗ_img
tại chỗ_img