제퍼넷 로고

태그: 파이 스파크

Amazon EMR 및 AWS IAM ID 센터를 통한 분석에 기업 ID 사용 | 아마존 웹 서비스

세분화된 데이터 액세스 제어 및 감사 데이터 액세스를 통해 인력 사용자가 분석할 수 있도록 하려면 여러 AWS ID를 생성해야 할 수도 있습니다.

톱 뉴스

모든 데이터 엔지니어가 알아야 할 7가지 Python 라이브러리 – KDnuggets

작성자의 이미지 데이터 엔지니어로서 알아야 할 도구 및 프레임워크 목록은 종종 어려울 수 있습니다. 하지만, 그 자리에서...

Amazon EMR Studio의 Amazon EMR 서버리스에서 대화형 워크로드 실행 | 아마존 웹 서비스

릴리스 6.14부터 Amazon EMR Studio는 Amazon EMR 서버리스에서 대화형 분석을 지원합니다. 이제 EMR 서버리스 애플리케이션을 컴퓨팅으로 사용할 수 있습니다...

Amazon EMR 및 Apache Griffin을 사용하여 대규모 데이터 검증 자동화 | 아마존 웹 서비스

많은 기업이 온프레미스 데이터 스토어를 AWS 클라우드로 마이그레이션하고 있습니다. 데이터 마이그레이션 중 핵심 요구 사항은 모든 데이터의 유효성을 검사하는 것입니다...

Amazon DataZone, 이제 AWS Glue 데이터 품질 및 외부 데이터 품질 솔루션과 통합 | 아마존 웹 서비스

오늘 Amazon DataZone이 이제 데이터 자산에 대한 데이터 품질 정보를 제공할 수 있게 되었음을 발표하게 되어 기쁘게 생각합니다. 이 정보는 최종 사용자에게 힘을 실어줍니다...

Amazon이 더 높은 확장성과 성능을 위해 Amazon EMR을 사용하여 대규모 금융 조정 프로세스를 최적화한 방법 | 아마존 웹 서비스

계정 조정은 재무제표의 완전성과 정확성을 보장하는 중요한 단계입니다. 특히 기업은 다음과 같은 대차대조표 계정을 조정해야 합니다.

PySpark에서 창 함수 작업

소개 PySpark의 창 기능을 배우는 것은 어려울 수 있지만 노력할 가치가 있습니다. 윈도우 함수는 데이터 분석을 위한 강력한 도구이며 다음을 수행할 수 있습니다.

프라이빗 NAT 게이트웨이를 사용하여 IP 주소 소비를 최적화하고 네트워크 용량을 확장하여 AWS Glue 작업 확장 | 아마존 웹 서비스

기업이 확장됨에 따라 기업 네트워크 내 IP 주소에 대한 수요가 공급을 초과하는 경우가 많습니다. 조직의 네트워크는 종종 다음과 같이 설계됩니다.

중요한 데이터를 보호하기 위해 AWS에서 가명처리 서비스 구축: 2부 | 아마존 웹 서비스

두 부분으로 구성된 이 시리즈의 1부에서는 일반 텍스트 데이터 속성을 가명 또는 그 반대로 변환하는 가명화 서비스를 구축하는 방법을 설명했습니다.

AWS Glue ETL을 사용하여 Apache Iceberg에서 병합, 파티션 발전 및 스키마 발전을 수행 | 아마존 웹 서비스

기업이 다양한 소스에서 점점 더 많은 양의 데이터를 수집함에 따라 해당 데이터의 구조와 구성은 시간이 지남에 따라 변경되어야 하는 경우가 많습니다.

데이터 과학과 Go 프로그래밍 언어 – KDnuggets

Northwestern University의 MSDS 프로그램 교수인 Tom Miller의 후원 콘텐츠 댓글입니다. 몇 년 전, 미네소타 대학교에서 응용통계학을 전공하던 시절...

데이터 기반 우수성 강화: Bluestone Data Platform이 성공을 위해 데이터 메시를 수용한 방법 | 아마존 웹 서비스

이 게시물은 Bluestone의 Toney Thomas 및 Ben Vengerovsky와 공동으로 작성되었습니다. 점점 더 발전하는 세상에서..

Amazon EMR의 기본 LDAP 통합으로 인증 단순화 | 아마존 웹 서비스

많은 회사에서는 AD(Active Directory) 또는 OpenLDAP와 같은 ID 공급자(IdP) 내부에 기업 ID를 저장하고 있습니다. 이전에는 Amazon EMR을 사용하는 고객이 통합할 수 있었습니다...

최신 인텔리전스

spot_img
spot_img