제퍼넷 로고

데이터 아키텍처 101

시간

데이터 아키텍처데이터 아키텍처

"데이터 아키텍처"라는 용어는 조직 내에서 데이터 흐름 및 관리를 관리하는 모델, 정책, 규칙 및 표준 집합으로 정의됩니다. 따라서 엔터프라이즈 아키텍처의 하위 집합인 데이터 아키텍처에는 데이터 캡처, 데이터 저장, 데이터 통합 ​​및 데이터 사용과 같은 데이터 관련 활동을 관리하는 운영 규칙이 포함됩니다. 즉, 이러한 모델, 표준, 정책 및 규칙 모음은 수집되는 데이터와 엔터프라이즈 데이터 시스템 내에서 데이터가 저장, 구성, 통합 및 사용되는 방식을 규제합니다.

데이터 아키텍처란 무엇입니까?

이에 따르면 데이터 관리 지식 체계 (DMBoK 2), 데이터 아키텍처는 데이터 자산을 관리하기 위한 "마스터 플랜"과 유사합니다. 내부 조직 정책 및 비즈니스 정책은 종종 데이터 아키텍처 설계를 안내합니다. 데이터 아키텍처 산출물에는 데이터 플랫폼 및 데이터 거버넌스 도구를 위한 다중 계층 인프라와 데이터 수집, 통합, 변환 및 저장을 위한 사양 및 표준이 포함됩니다.

데이터 아키텍처 부트캠프에 참여하세요

27년 2월 2023일부터 XNUMX월 XNUMX일까지 진행되는 이 라이브 온라인 교육을 위해 자리를 비우고 최신 데이터 아키텍처로의 여정을 가속화하십시오.

XNUMXD덴탈의 데이터 설계자 조직의 목표, 문화 및 상황별 요구 사항과 일치하는 아키텍처 청사진을 개발합니다. 일반적으로 다자간 데이터 프로젝트 중에 데이터 설계자는 조직 목표를 중심으로 많은 부서와 이해 관계자를 조정하는 중심 인물 역할을 합니다.

데이터 아키텍처의 구성 요소는 무엇입니까?

가장 기본적인 엔터프라이즈 데이터 아키텍처의 구성 요소 다음을 포함한다 :

  • 데이터 파이프라인은 저장, 정리, 분석, 한 지점에서 다른 지점으로의 데이터 흐름 등 데이터 수집의 전체 프로세스로 구성됩니다. 
  • 클라우드 스토리지는 인터넷을 통해 액세스하는 하나 이상의 원격 클라우드 서버에 데이터가 있는 호스팅 서비스가 있음을 나타냅니다.
  • 클라우드 컴퓨팅 클라우드 호스트에서 데이터를 저장, 관리 및 분석하는 프로세스를 말합니다. 클라우드 컴퓨팅의 가장 큰 이점은 저렴한 비용, 데이터 보안 및 온프레미스 인프라 요구 사항이 없다는 것입니다. 
  • API는 호스트 시스템과 서비스 요청자 간의 통신을 용이하게 합니다. 
  • AI 및 ML 모델은 데이터 아키텍처에 자동화된 기능을 제공합니다. 이러한 모델은 데이터 아키텍처의 많은 핵심 기능을 자동화합니다. 
  • 데이터 스트리밍은 실시간으로 데이터를 소스에 가깝게 처리해야 하는 지속적인 데이터 흐름 기능을 지원합니다.   
  • 실시간 분석은 즉시 실행 가능한 통찰력을 위해 실시간으로 데이터 분석을 정의합니다. 
  • Kubernetes, 컴퓨팅, 네트워킹 및 스토리지 워크로드를 처리하기 위한 원스톱 플랫폼입니다.

데이터 아키텍처의 핵심 원칙은 무엇입니까?

다음은 핵심 원칙 데이터 아키텍처가 구축되는 주변:

  • 자동화 : 자동화는 레거시 데이터 시스템의 모든 장애를 제거했습니다. 최신 데이터 아키텍처를 사용하면 몇 시간 만에 프로세스를 구축할 수 있고, 데이터 파이프라인을 통해 모든 유형의 데이터에 빠르게 액세스할 수 있으며, 민첩한 데이터 통합을 촉진하고, 지속적인 데이터 흐름을 허용합니다.
  • 보안 : 최신 데이터 아키텍처에 내장된 보안 기능은 알아야 할 필요가 있는 경우에만 데이터를 사용할 수 있도록 합니다. 모든 데이터는 HIPAA 및 GDPR과 같은 규제 기관을 준수합니다.
  • 사용자 오리엔테이션: 최신 데이터 아키텍처는 사용자가 필요할 때 언제 어디서나 데이터에 액세스할 수 있도록 합니다.
  • 회복력:  데이터 아키텍처는 높은 데이터 가용성, 재해 복구 조치 및 적절한 백업/복원 기능을 약속합니다.
  • 유연한 데이터 파이프라인: 최신 데이터 아키텍처는 데이터 스트리밍 및 "데이터 버스트"를 지원합니다.
  • 협동: 잘 설계된 데이터 아키텍처는 사일로를 제거하고 조직의 모든 부분의 데이터가 단일 위치에 공존할 수 있도록 하여 협업을 촉진합니다.
  • AI 기반: AI와 ML은 함께 변화하는 조건에 대한 경고 및 권장 사항을 제공하여 데이터 아키텍처의 자동화된 기능을 강화합니다. 
  • 탄력: 이 특성을 통해 조직은 온디맨드 확장 기능을 빠르고 저렴하게 사용할 수 있습니다. 이와 동일한 특성으로 인해 관리자는 많은 지루한 작업에서 벗어나 중요한 작업에 집중할 수 있습니다.
  • 간단: 데이터 아키텍처를 통해 조직은 데이터 이동 및 데이터 복제를 제한하고 단일 데이터베이스 플랫폼을 옹호할 수 있습니다.

이것도 검토 DATAVERSITY® 기사 추가 데이터 아키텍처 원칙에 대해.

최신 트렌드와 과제는 무엇입니까? 

조직 전체에서 광범위한 데이터를 캡처, 처리, 관리 및 분석하기 위한 새로운 기술과 아키텍처가 지속적으로 등장하고 있습니다. 클라우드에서의 스토리지 및 처리 혁신 외에도 기업은 다음으로 이동하고 있습니다. 데이터 아키텍처에 대한 새로운 접근 방식 빅 데이터와 함께 제공되는 다양성, 진실성 및 볼륨을 관리할 수 있습니다. 

긴 목록에서 데이터 아키텍처 동향 2021년을 형성하면서 주목할 가치가 있는 것은 데이터 액세스의 민주화, AI 지원 아키텍처, 데이터 설계자의 부상, 데이터 패브릭, 데이터 카탈로그, DevOps, 그리고 물론 클라우드입니다. 2021년 이후에는 다음과 같습니다. 일부 트렌드 보기:

  • 많은 데이터 아키텍처 리더가 전사적 중앙 데이터 레이크에서 데이터 레이크로 이동하고 있습니다. 도메인 기반 디자인, 데이터 위에 구축된 새로운 제품 및 서비스의 시장 출시 시간을 늘리기 위해 목적에 맞게 사용자 정의할 수 있습니다. 
  • 고도로 모듈화된 데이터 아키텍처로의 이동이 여기에 있습니다. 모듈식 개념은 데이터 아키텍처의 나머지 부분에 영향을 주지 않고 필요할 때 새로운 기술로 교체할 수 있는 최고의 오픈 소스 구성 요소를 사용합니다. 
  • 보다 최근에는 기업에서 클라우드 컴퓨팅 채택이 증가하면서 데이터 아키텍처 개념이 등장했으며, 클라우드 기반 플랫폼 모든 또는 대부분의 데이터 관리 작업을 위해. 
  • 빅 데이터 아키텍처는 기존 데이터베이스에서 처리하기 어려운 방대한 양, 속도 및 다양한 데이터를 수집, 처리, 저장, 관리, 액세스 및 분석하는 개념적 또는 물리적 시스템입니다. 빅 데이터 기술은 범용 애플리케이션 아키텍처에서 흔히 볼 수 없는 프레임워크와 언어를 사용하여 매우 전문화되어 있습니다. 
  • 다양한 데이터 유형을 처리할 수 있는 AI 기반 클라우드 서비스가 증가하고 있습니다. 데이터 액세스 수요가 증가함에 따라 복잡한 멀티 클라우드 하이브리드 환경 내에서 AI 및 ML을 지원해야 합니다. 
  • 으로 데이터 패브릭 다양한 클라우드 설정에서 더 빠른 데이터 분석을 가능하게 하고, 데이터 패브릭의 성장은 하이브리드 및 멀티 클라우드의 성장을 의미합니다. 
  • 고성능 데이터 아키텍처 모델, 아직 초기 단계이지만 빠르게 발전하고 있습니다. 예측 분석, 응용 AI 및 ML과 같은 고급 데이터 과학 애플리케이션에는 대용량 및 고속 데이터 환경이 필요하며 현재 이러한 조건은 하이브리드 및 멀티 클라우드로만 달성할 수 있습니다.
  • 잘 설계된 빅 데이터 아키텍처는 기업이 더 쉽게 데이터를 처리하고 미래 추세를 예측하여 현명한 결정을 내릴 수 있도록 합니다. 기업은 빅 데이터 분석 기술을 사용하여 비즈니스 인텔리전스 및 분석 이니셔티브를 최적화하고 데이터 웨어하우징 기술에 의존하는 느린 보고 도구를 넘어 고객 행동, 비즈니스 프로세스 및 전반적인 운영에 대한 더 나은 통찰력을 제공하는 더 스마트하고 반응이 빠른 애플리케이션으로 이동하고 있습니다. 
  • 이 추세는 이전 추세와 관련이 있습니다. AWS, Microsoft, Google 및 IBM과 같은 클라우드 인프라 제공업체는 거의 무제한에 가까운 새로운 데이터를 처리하고 온디맨드 스토리지 및 컴퓨팅 기능을 제공할 수 있습니다. 

한 가지 큰 과제는 데이터를 처리하고 저장하는 새로운 기술이 등장하고 있지만 데이터 양이 대략 50년마다 크기가 두 배로 증가하고 있다는 것입니다. Gartner 분석가들은 2025년까지 비즈니스 크리티컬 데이터의 XNUMX% 이상이 데이터 센터 또는 클라우드 외부에서 생성 및 처리될 것으로 예상합니다. 데이터 인프라의 미래를 위한 세 가지 주요 동인은 퍼블릭 클라우드, SaaS 서비스로 이동하는 것으로 설명할 수 있습니다. , 향상된 데이터 엔지니어링.

두 번째 과제는 하이브리드 및 멀티 클라우드와 관련이 있습니다. 이러한 환경이 점점 대중화되고 있는 동안, 지속적인 데이터 보안 및 관리 문제로 인해 기업은 멀티 클라우드 옵션보다 하이브리드에 더 관심을 갖게 되었습니다. 다양한 솔루션을 갖춘 클라우드 플랫폼만이 속도, 규모 및 사용 용이성 데이터 품질은 계속 남아 있는 문제가 되겠지만 엔터프라이즈급 데이터 관리 플랫폼의 

최신 데이터 플랫폼은 IT 중심의 코딩 프로세스가 아닌 비즈니스 중심의 가치 사슬을 중심으로 구축됩니다. 여기서 기존 아키텍처의 복잡성은 이벤트 스트림을 분석 가능한 데이터로 변환하는 단일 셀프 서비스 플랫폼으로 추상화됩니다. .

세 번째 문제는 새로운 데이터 기술이 데이터 아키텍처의 복잡성을 극적으로 증가시켜 조직이 새로운 기능을 배포하고 기존 인프라를 유지하며 AI 모델의 무결성을 보장하는 능력을 지속적으로 방해하는 경우가 많다는 것입니다.

데이터 아키텍처와 데이터 모델링의 차이점은 무엇입니까?

DaVinci에는 데이터 아키텍처와 데이터 모델링 모두 데이터 기술을 비즈니스 목표와 일치시키기 위해 노력하지만, 데이터 아키텍처는 비즈니스 기능, 기술 및 데이터 간의 관계를 유지하는 데만 중점을 둡니다. 요컨대 데이터 아키텍처는 데이터 시스템 전반에 걸쳐 표준을 설정하고 데이터 시스템이 상호 작용하는 방식에 대한 비전 또는 패턴 역할을 합니다. 데이터 설계자는 조직의 데이터 인프라에 대한 비전과 청사진을 개발하고 데이터 엔지니어 이 비전을 만드는 일을 담당하고 있습니다.

그것은 난 AUTRE 손, 데이터 모델러는 애플리케이션 개발자와 협력하여 개발된 애플리케이션에 의해 구현된 비즈니스 프로세스를 이해하고 해당 애플리케이션을 지원하는 데이터에 대한 최상의 표현을 식별합니다. 데이터 모델링은 저장하려는 정보를 제공하는 모델과 함께 데이터와 그 관계를 중심으로 구축되며 최종 제품이 응용 프로그램용 컴퓨터 소프트웨어 코드를 생성하거나 기능 사양을 준비하는 경우 주요 가치가 있습니다. 컴퓨터 소프트웨어에 대한 결정을 안내하는 데 도움이 됩니다.

엔터티-관계 모델은 다이어그램을 사용하여 데이터와 그 관계를 묘사합니다. 데이터 모델은 엔티티 관계 모델, 관계형 데이터베이스, 비즈니스 지향 언어 또는 객체 모델링 언어로 직접 변환될 수 있습니다. 

Enterprise Architect 데이터 모델링 프로세스 중에 데이터 모델은 데이터 개체에 대한 통찰력을 추출하는 사람들이 논리적이고 쉽게 이해할 수 있어야 합니다. 그만큼 엔터프라이즈 아키텍처 데이터 모델링 프로세스에는 적절한 계획이 필요하며 개념적 모델, 논리적 모델 및 물리적 모델의 세 단계가 포함됩니다. 

Shutterstock.com의 라이센스에 따라 사용 된 이미지

spot_img

최신 인텔리전스

spot_img