제퍼넷 로고

데이터 관찰 가능성: 정의 및 중요한 이유 – DATAVERSITY

시간

데이터 관찰 가능성데이터 관찰 가능성

프로세스로서 데이터 관찰 가능성은 방대한 양의 데이터로 작업하는 기업에서 사용됩니다. 많은 대규모 현대 조직에서는 다양한 애플리케이션과 도구를 사용하여 데이터를 모니터링하려고 합니다. 불행히도 현실적인 개요에 필요한 가시성을 개발하는 기업은 거의 없습니다. 

데이터 관찰 가능성은 가능한 한 빨리 데이터 흐름 문제를 제거하기 위해 해당 개요를 제공합니다.

관찰 가능성 프로세스에는 데이터 문제를 실시간으로 식별하고 해결하는 데 도움이 되는 다양한 방법과 기술이 포함됩니다. 이 프로세스는 비즈니스의 전체 데이터 흐름에 대한 다차원 지도를 구축하여 시스템의 성능 및 데이터 품질에 대한 더 깊은 통찰력을 제공합니다. 

데이터 관찰 가능성에 대한 질문에 IBM 회사인 Databand의 CMO인 Ryan Yackel은 다음과 같이 말했습니다.

“빅 데이터 파이프라인의 볼륨, 속도 및 복잡성이 계속 증가함에 따라 기업은 데이터 엔지니어링 및 플랫폼 팀을 데이터 기반 비즈니스의 중추로 삼고 있습니다. 문제는 이러한 팀의 대부분이 작업을 중단한다는 것입니다. 신뢰성 및 품질 문제로 데이터와 싸우고 있어 AL/ML, 분석 및 데이터 제품과 관련된 전략적 이니셔티브에 집중하기 어렵습니다. 데이터 관찰 가능성이 솔루션을 제공합니다.”

처음에는 데이터 관찰 가능성이 데이터 계보, 그러나 두 프로세스는 다른 용도로 사용됩니다. 

데이터 관찰 가능성은 측정 시스템을 사용하여 빠르고 효율적으로 데이터 문제를 해결하는 데 중점을 둡니다. 그러나 데이터 계보는 주로 고품질 데이터(신뢰할 수 있는 데이터)를 수집하고 저장하는 데 사용됩니다.

또한 데이터 계보는 가시성 프로그램을 지원하는 구성 요소로 사용할 수 있습니다. (일부 기사는 데이터 계보와 동일한 목적을 제공하는 것으로 데이터 관찰 가능성을 홍보하며 주장에 대한 일부 진실이 있습니다. 데이터 계보는 데이터 관찰 가능성의 구성 요소입니다.) 

"관찰 가능성"이라는 용어는 원래 기원전 510년경 헤라클레이토스가 개발한 철학적 개념이었습니다. 그는 관찰 가능성에 비교 차이가 필요하다고 결정했습니다. 추위는 따뜻함과 비교하여 관찰될 수 있습니다. 1871년 물리학자 제임스 C. 맥스웰(James C. Maxwell)은 열역학 실험에서 모든 입자의 위치를 ​​아는 것은 불가능하지만 비교 변화에 대한 "특정 핵심 결과"를 관찰함으로써 정확한 예측을 할 수 있다는 생각을 발전시켰습니다. 

주요 출력을 사용한 관측 가능성에 대한 Maxwell의 설명은 공장 장비에서 항공기 센서에 이르기까지 다양한 자동화 애플리케이션에 적용 및 적용되었습니다. 이 개념은 대략 2016년에 DevOps에서 "생산 사고"를 디버깅하고 처리하기 위해 채택되었습니다. 2019년에 Monte Carlo의 CEO이자 공동 설립자인 Barr Moses는 조직의 데이터 흐름에 대한 개요를 제공하도록 설계된 관찰 가능성 프로세스를 개발했습니다. . 

모세가 썼다

“데이터 관찰 가능성은 시스템의 데이터 상태를 완전히 이해하는 조직의 능력입니다. 데이터 관찰 가능성은 다음에서 학습한 모범 사례를 적용하여 데이터 다운타임을 제거합니다. 개발자 에 데이터 파이프라인 관찰 가능성. "

데이터 관찰 가능성의 XNUMX가지 요소

Data Observability는 데이터에 대한 철저한 지도를 실시간으로 제공하여 데이터 및 정보 문제를 해결합니다. 조직의 데이터 활동에 대한 가시성을 제공합니다. 많은 기업이 고립된 데이터를 가지고 있어 관찰 가능성을 차단합니다. 데이터 관찰 프로그램을 지원하려면 데이터 사일로를 제거해야 합니다. 

추적, 모니터링, 경고, 분석, 로깅 및 "비교"와 같은 활동이 관찰 가능성 대시보드 없이 수행되면 일종의 조직 분할이 발생할 수 있습니다. 한 부서의 사람들은 자신의 노력이 다른 부서에 의도하지 않은 결과를 초래한다는 사실을 깨닫지 못합니다. 예를 들어 잘못된 의사 결정을 조장하는 누락/사일로된 정보 또는 시스템 일부가 다운되어 아무도 깨닫지 못하는 경우입니다. 

관찰 가능성은 특정 주요 출력을 측정하는 것입니다. Barr Moses가 측정 목적으로 개발한 XNUMX가지 기둥(또는 핵심 결과)은 다음과 같습니다. 

  • 품질 : 고품질 데이터는 정확한 것으로 간주되지만 낮은 품질의 데이터는 정확하지 않습니다. 데이터 품질 측정은 데이터를 신뢰할 수 있는지 여부에 대한 통찰력을 제공합니다. 다양한 방법이 있습니다 측정 데이터 품질.
  • 개요: 여기에는 데이터가 구성되는 방식의 변경이 포함되며 스키마 측정은 데이터 흐름의 중단을 표시할 수 있습니다. 언제, 어떻게, 누가 변경했는지 확인하는 것은 예방적 유지 관리 측면에서 유용할 수 있습니다. 
  • 음량: 많은 양의 데이터가 연구 및 마케팅 목적에 유용합니다. 이를 통해 조직은 고객과 시장을 통합적으로 파악할 수 있습니다. 연구 중에 사용된 최신 및 과거 데이터가 많을수록 더 많은 통찰력을 얻을 수 있습니다.
  • 데이터 계보: 우수한 데이터 계보 프로그램은 데이터 및 해당 위치의 변경 사항을 기록하며 일반적으로 데이터 품질을 개선하는 데 사용됩니다. 그러나 데이터 관찰 프로그램의 일부로 사용할 수도 있습니다. 이 용량에서 발생할 수 있는 중단 문제를 해결하고 손상 전에 수행된 작업을 나열하는 데 사용됩니다. 
  • 선도: 이것은 본질적으로 오래된 정보 또는 Barr Moses가 언급한 오래된 데이터를 사용하지 않는 것에 관한 것입니다. 선도 데이터 기반 의사 결정을 내릴 때 중요한 최신 데이터를 강조합니다. 타임스탬프는 일반적으로 데이터가 오래된지 확인하는 데 사용됩니다. 

이러한 구성 요소 또는 기둥의 측정을 결합하면 발생하거나 단순히 나타나는 문제에 대한 귀중한 통찰력을 제공하고 가능한 한 빨리 수리할 수 있는 능력을 촉진할 수 있습니다.

데이터 관찰 가능성 문제

올바른 데이터 관찰 가능성 플랫폼은 기업이 데이터를 유지하고 관리하는 방식을 혁신할 수 있습니다. 불행히도 플랫폼을 구현하면 몇 가지 문제가 발생할 수 있습니다. 호환성 문제는 플랫폼이 적합하지 않을 때 나타납니다. 

데이터 파이프라인, 소프트웨어, 서버 및 데이터베이스가 완전히 호환되지 않는 경우 관찰 가능성 플랫폼 및 도구가 제한될 수 있습니다. 이러한 플랫폼은 진공 상태에서 작동하지 않으므로 모든 플랫폼을 제거하는 것이 중요합니다. 데이터 사일로 시스템에서 제거하고 조직 내의 모든 데이터 시스템이 통합되었는지 확인합니다. 

계약을 체결하기 전에 데이터 관찰 가능성 플랫폼을 테스트하는 것이 중요합니다.

안타깝게도 모든 비즈니스의 내부 및 외부 데이터 소스가 플랫폼에 올바르게 통합되더라도 서로 다른 데이터 모델 문제를 일으킬 수 있습니다. 많은 기업이 400개 이상의 데이터 소스를 지원하며 각 외부 소스가 동일한 표준 및 형식을 사용하지 않는 경우 문제가 발생할 수 있습니다.

오픈 소스 도구를 제외하고 관찰 가능성 플랫폼은 클라우드 기반이며 미세 조정을 지원하는 유연성을 제공할 수 있습니다. 

최고의 관찰 가능성 플랫폼은 표준화된 측정 프로세스 및 로깅 지침에 중점을 둡니다. 이는 정보의 효과적인 상관 관계를 촉진하지만 외부 데이터 소스와 사용자 정의된 데이터 파이프라인은 문제를 일으킬 수 있으며 자동화해야 하는 작업을 수행하기 위해 추가적인 수동 작업이 필요할 수 있습니다.

또한 일부 도구에는 확장성을 제한하는 비정상적인 스토리지 비용이 포함될 수 있습니다.

데이터 관찰 플랫폼

데이터 관찰 가능성 플랫폼에는 일반적으로 다양한 유용한 도구가 포함되어 있습니다. 여기에는 자동화된 데이터 계보, 근본 원인 분석, 데이터 품질 및 데이터 흐름 내 이상을 식별, 해결 및 방지하기 위한 모니터링에 대한 자동화된 지원이 포함되는 경우가 많습니다. 

플랫폼은 생산성 향상, 더 건강한 파이프라인, 더 행복한 고객을 촉진합니다. 일부 인기 있는 데이터 관찰 가능성 플랫폼은 다음과 같습니다.

  • 데이터 밴드 비즈니스에 영향을 미치기 전에 데이터 문제를 식별하는 지속적인 관찰 가능성 프로세스를 사용하여 데이터 문제를 매우 빠르게 감지하고 해결할 수 있는 고도로 기능적인 관찰 가능성 플랫폼을 제공합니다. 
  • 몬테 카를로 관찰 가능성을 제공하는 것으로 설명할 수 있는 관찰 가능성 플랫폼을 제공합니다. 비즈니스 인텔리전스.” 다양한 데이터 서비스 및 도구의 오케스트레이션에 데이터 안정성을 제공합니다. 
  • 다양한이 있습니다 오픈 소스 조사할 가치가 있는 가시성 도구를 사용할 수 있습니다.

데이터 관찰 가능성의 중요성

대규모 데이터 흐름을 처리하는 조직의 경우 관찰 가능성을 사용하여 데이터 시스템 전체를 모니터링하고 문제가 나타날 때 위험 신호를 보낼 수 있습니다. 

기업이 다양한 소스에서 방대한 양의 데이터를 수집함에 따라 이를 처리하기 위한 시스템을 계층적으로 개발합니다. 이러한 시스템에는 데이터 저장소, 데이터 파이프라인 및 다양한 도구가 포함됩니다. 복잡성이 추가될 때마다 비호환성 또는 오래되고 누락된 데이터와 같은 문제로 인한 데이터 가동 중지 가능성이 높아집니다.

Yackel에 따르면 “데이터 파이프라인, 데이터 세트 및 데이터 테이블을 모니터링하기 위해 데이터 관찰 기능을 지속적으로 사용하면 데이터 사고가 발생할 때 데이터 팀에 경고를 보내고 근본 원인이 비즈니스에 영향을 미치기 전에 해결하는 방법을 알 수 있습니다. 데이터 관찰 가능성을 통해 엔지니어링은 중단된 프로세스를 유지하는 대신 우수한 데이터 제품을 구축하는 데 집중할 수 있습니다.” 

데이터 관찰 가능성은 기업이 파이프라인 문제, 데이터 오류 및 데이터 흐름 불일치의 원인을 사전에 식별하여 고객 관계를 강화하고 데이터 품질을 개선하는 데 도움이 됩니다.

Shutterstock.com의 라이센스에 따라 사용 된 이미지

spot_img

최신 인텔리전스

spot_img

우리와 함께 채팅

안녕하세요! 어떻게 도와 드릴까요?