ゼファーネットのロゴ

タグ: Apacheハイブ

Amazon S3、AWS Glue、Snowflake を使用してデータレイクで Apache Iceberg を使用する |アマゾン ウェブ サービス

この投稿は、Snowflake の Andries Engelbrecht と Scott Teal との共同執筆です。ビジネスは常に進化しており、...

トップニュース

AWS Lake Formation 2023 年の振り返り |アマゾン ウェブ サービス

AWS Lake Formation と AWS Glue データ カタログは、Amazon 上に構築されたデータレイクのデータ ガバナンス ソリューションの不可欠な部分を形成します。

AWS Lake Formation と統合された Amazon EMR を介して Open Table Format に対してきめ細かいアクセス制御を適用する |アマゾン ウェブ サービス

Amazon EMR 6.15 では、Apache Hudi、Apache Iceberg などの Open Table Format (OTF) 上で AWS Lake Formation ベースのきめ細かいアクセス制御 (FGAC) を開始しました。

GoDaddy ベンチマークの結果、Amazon EMR サーバーレス上の AWS Graviton24 を使用した Spark ワークロードの価格パフォーマンスが最大 2% 向上しました。 アマゾン ウェブ サービス

これは、ソフトウェア開発エンジニアの Mukul Sharma および GoDaddy のエンジニアリング ディレクターの Ozcan IIikhan との共同執筆によるゲスト投稿です。 GoDaddy は日常の起業家に力を与えます...

AWS Step 関数を使用して Amazon EMR サーバーレス ジョブを調整する | アマゾン ウェブ サービス

Amazon EMR サーバーレスは、Apache Spark などの最新のオープンソース フレームワークを使用する分析アプリケーションの操作を簡素化するサーバーレス ランタイム環境を提供します。

EC2 クラスター上の Amazon EMR のキャパシティ管理と Amazon EMR マネージド スケーリングの改善 | アマゾン ウェブ サービス

2022 年に、クラスターの使用率とクラスターの使用率の向上に役立つ Amazon EMR マネージド スケーリングの新しい機能強化についてお話しました。

Ontraport が AWS Glue を使用してデータ処理コストを 80% 削減した方法 | アマゾン ウェブ サービス

この投稿は、オントラポートの Elijah Ball と共同で書かれています。 お客様は、データと分析のワークロードを AWS クラウドに実装して最適化しています。

AWS Lake Formation 権限を使用して Apache Hive メタストアをクエリする | アマゾン ウェブ サービス

Apache Hive は、Apache Hadoop プラットフォーム上で高度に分散されたデータセットを処理するための SQL ベースのデータ ウェアハウス システムです。 重要なコンポーネントは XNUMX つあります...

Zoom が Amazon EMR で Apache Hudi を使用してストリーミング ログの取り込みと効率的な GDPR 削除を実装した方法 | アマゾン ウェブ サービス

今日のデジタル時代では、ログはアプリケーションの開発と管理の重要な側面ですが、データ保護規制を遵守しながらログを効率的に管理することは...

Amazon Athena を使用して Apache Iceberg テーブルを操作し、AWS Lake Formation を使用してクロスアカウントのきめ細かいアクセス許可を操作します

最近、サポートされているファイル形式で保存されたデータに対する Amazon Athena クエリでの AWS Lake Formation のきめ細かいアクセス制御ポリシーのサポートを発表しました...

Amazon SageMaker Data Wrangler と Apache Hive のパワーで洞察を得るまでの時間を短縮

Amazon SageMaker Data Wrangler は、Amazon での機械学習 (ML) 用のデータの集約と準備にかかる時間を数週間から数分に短縮します...

Apache Flume の詳細: インストール、セットアップ、構成

はじめに Apache Flume は、ログ ファイルなどのさまざまなソースから膨大な量のストリーミング データを収集、集約、配信するためのツール/サービス/データ取り込みメカニズムです。

20 年に専門家が使用するトップ 2023 のビッグデータ ツール

はじめに ビッグ データは、さまざまなソースから生成される大規模で複雑なデータセットであり、指数関数的に増加します。 それは非常に広範かつ多様であるため、従来のデータは...

最新のインテリジェンス

スポット画像
スポット画像