Met Amazon EMR 6.15 hebben we op AWS Lake Formation gebaseerde fijnmazige toegangscontroles (FGAC) gelanceerd op Open Table Formats (OTF's), waaronder Apache Hudi, Apache Iceberg,...
Dit is een gastpost die is geschreven in samenwerking met Mukul Sharma, Software Development Engineer, en Ozcan IIikhan, Director of Engineering van GoDaddy. GoDaddy ondersteunt alledaagse ondernemers...
Amazon EMR Serverless biedt een serverloze runtime-omgeving die de werking vereenvoudigt van analysetoepassingen die gebruik maken van de nieuwste open source-frameworks, zoals Apache Spark...
In 2022 vertelden we u over de nieuwe verbeteringen die we hebben aangebracht in Amazon EMR Managed Scaling, die hebben bijgedragen aan het verbeteren van het clustergebruik en...
Apache Hive is een op SQL gebaseerd datawarehouse-systeem voor het verwerken van zeer gedistribueerde datasets op het Apache Hadoop-platform. Er zijn twee belangrijke componenten om...
In het huidige digitale tijdperk is logboekregistratie een essentieel aspect van de ontwikkeling en het beheer van applicaties, maar het efficiënt beheren van logboeken terwijl wordt voldaan aan de voorschriften voor gegevensbescherming...
We hebben onlangs ondersteuning aangekondigd voor het fijnmazige toegangscontrolebeleid van AWS Lake Formation in Amazon Athena-query's voor gegevens die zijn opgeslagen in elk ondersteund bestandsformaat...
Amazon SageMaker Data Wrangler verkort de tijd die nodig is om gegevens te aggregeren en voor machine learning (ML) voor te bereiden van weken naar minuten in Amazon...
Inleiding Apache Flume is een tool/service/gegevensopnamemechanisme voor het verzamelen, aggregeren en leveren van enorme hoeveelheden streaminggegevens uit diverse bronnen, zoals logbestanden,...
Inleiding Big Data is een grote en complexe dataset die wordt gegenereerd door verschillende bronnen en die exponentieel groeit. Het is zo omvangrijk en divers dat traditionele data...