Тег: улей apache

Погрузитесь глубже в управление безопасностью: данные о платформе EKS | Веб-сервисы Amazon

Big Data 29 апреля 2024

Создание приложений для больших данных на основе программного обеспечения с открытым исходным кодом становится все более простым с появлением таких проектов, как Data on EKS,...

Главные новости

Используйте Apache Iceberg в своем озере данных с помощью Amazon S3, AWS Glue и Snowflake | Веб-сервисы Amazon

Big Data 3 апреля 2024

Как Amazon оптимизировал процесс крупномасштабной финансовой выверки с помощью Amazon EMR для повышения масштабируемости и производительности | Веб-сервисы Amazon

Big Data 28 марта 2024

Как платформа данных GoDaddy добилась снижения затрат более чем на 60 % и повышения производительности на 50 % благодаря внедрению Amazon EMR Serverless | Веб-сервисы Amazon

Big Data 12 марта 2024

20 технологий в области науки о данных для профессионалов

AI5 февраля 2024

Введение По мере роста использования Интернета компании используют данные для инноваций и получения конкурентных преимуществ. По данным на 66.2% мирового населения, подключенного к Интернету...

Обзор AWS Lake Formation за 2023 год | Веб-сервисы Amazon

Big Data18 января 2024

AWS Lake Formation и каталог данных AWS Glue являются неотъемлемой частью решения по управлению данными для озер данных, созданных на базе Amazon...

Обеспечьте детальный контроль доступа к форматам открытых таблиц с помощью Amazon EMR, интегрированного с AWS Lake Formation | Веб-сервисы Amazon

Big Data17 января 2024

В Amazon EMR 6.15 мы запустили детальный контроль доступа (FGAC) на базе AWS Lake Formation для форматов открытых таблиц (OTF), включая Apache Hudi, Apache Iceberg и...

Результаты сравнительного анализа GoDaddy позволили повысить соотношение цены и качества для рабочих нагрузок Spark до 24 % с помощью AWS Graviton2 на Amazon EMR Serverless | Веб-сервисы Amazon

Big Data2 ноября 2023

Это гостевой пост, написанный совместно с Мукулом Шармой, инженером по разработке программного обеспечения, и Озджаном Ильханом, техническим директором GoDaddy. GoDaddy расширяет возможности обычных предпринимателей...

Организуйте бессерверные задания Amazon EMR с помощью функций AWS Step | Веб-сервисы Amazon

Big Data12 октября 2023

Amazon EMR Serverless предоставляет бессерверную среду выполнения, которая упрощает работу аналитических приложений, использующих новейшие платформы с открытым исходным кодом, такие как Apache Spark...

Улучшения управления емкостью и управляемого масштабирования Amazon EMR для Amazon EMR в кластерах EC2 | Веб-сервисы Amazon

Big Data7 сентября, 2023

В 2022 году мы рассказывали вам о новых улучшениях, которые мы внесли в управляемое масштабирование Amazon EMR, которые помогли улучшить использование кластера, а также…

Как Ontraport сократил затраты на обработку данных на 80 % с помощью AWS Glue | Веб-сервисы Амазонки

Big Data11 августа 2023

Этот пост написан в сотрудничестве с Элайджей Боллом из Ontraport. Клиенты внедряют рабочие нагрузки данных и аналитики в облаке AWS, чтобы оптимизировать...

Запросите хранилище метаданных Apache Hive с разрешениями AWS Lake Formation | Веб-сервисы Амазонки

Big DataИюль 20, 2023

Apache Hive — это система хранилища данных на основе SQL для обработки сильно распределенных наборов данных на платформе Apache Hadoop. Есть два ключевых компонента для...

Как Zoom реализовал прием журналов потоковой передачи и эффективное удаление GDPR с помощью Apache Hudi в Amazon EMR | Веб-сервисы Амазонки

Big Data16 мая 2023

В сегодняшнюю цифровую эпоху ведение журналов является критически важным аспектом разработки приложений и управления ими, но эффективное управление журналами при соблюдении правил защиты данных...

Взаимодействуйте с таблицами Apache Iceberg с помощью Amazon Athena и детализируйте разрешения между учетными записями с помощью AWS Lake Formation.

Big Data23 марта 2023

Недавно мы объявили о поддержке политик детального контроля доступа AWS Lake Formation в запросах Amazon Athena для данных, хранящихся в любом поддерживаемом формате файлов...

Ускорьте получение аналитической информации с помощью Amazon SageMaker Data Wrangler и возможностей Apache Hive

AI10 марта 2023

Amazon SageMaker Data Wrangler сокращает время, необходимое для агрегирования и подготовки данных для машинного обучения (ML), с недель до минут в Amazon...

Погружение в Apache Flume: установка, настройка и настройка

Big Data7 марта 2023

Введение Apache Flume — это инструмент/сервис/механизм приема данных для сбора, агрегирования и доставки огромных объемов потоковых данных из различных источников, таких как файлы журналов,...

12 3...108 Страница 1