제퍼넷 로고

IBM Databand: 이상 탐지를 위한 자가 학습 – IBM 블로그

시간


IBM Databand: 이상 탐지를 위한 자가 학습 – IBM 블로그



창의적인 사무실의 테이블에서 토론하는 엔지니어

거의 1년 전, IBM은 시간에 민감한 인수합병 데이터 흐름 중 하나에서 데이터 검증 문제에 직면했습니다. 문제 해결, 문제 식별, 데이터 흐름 수정, 다운스트림 데이터 파이프라인 변경, 자동화된 워크플로의 임시 실행 수행 등 문제를 해결하기 위해 작업하는 동안 몇 가지 문제에 직면했습니다.

Databand를 통한 데이터 해상도 향상 및 모니터링 효율성 향상

즉각적인 문제가 해결된 후 회고적 분석을 통해 적절한 데이터 검증과 지능형 모니터링을 통해 문제가 완화되고 해결 시간이 단축되었을 수 있다는 사실이 밝혀졌습니다. IBM은 즉각적인 문제만을 위한 맞춤형 솔루션을 개발하는 대신 이 시나리오뿐만 아니라 간과될 수 있는 잠재적인 문제도 처리할 수 있는 광범위하게 적용 가능한 데이터 검증 솔루션을 모색했습니다.  

바로 그때 저는 최근 인수한 제품 중 하나인 데이터 관찰성을 위한 IBM® Databand®를 발견했습니다. 규칙 기반 모니터링이나 수백 개의 맞춤형 개발 모니터링 스크립트를 사용하는 기존 모니터링 도구와 달리 Databand는 자가 학습 모니터링을 제공합니다. 과거 데이터 동작을 관찰하고 특정 임계값을 초과하는 편차를 식별합니다. 이 기계 학습 기능을 통해 사용자는 데이터 또는 해당 동작 패턴에 대한 지식이 제한적인 경우에도 최소한의 규칙 구성 및 이상 탐지만으로 데이터를 모니터링할 수 있습니다.

Databand의 자체 학습 모니터링을 통해 데이터 흐름 관찰 가능성 최적화

Databand는 데이터 흐름의 과거 동작을 고려하고 의심스러운 활동에 플래그를 지정하는 동시에 사용자에게 경고합니다. IBM은 Databand를 100개 이상의 파이프라인으로 구성된 데이터 흐름에 통합했습니다. 모든 실행 및 파이프라인에 대해 쉽게 관찰할 수 있는 상태 업데이트를 제공했으며, 더 중요한 것은 강조된 오류를 제공했습니다. 이를 통해 우리는 데이터 흐름 사고의 해결에 집중하고 가속화할 수 있었습니다.

데이터 관측성을 위한 데이터밴드는 자가 학습을 사용하여 다음을 모니터링합니다.  

  • 스키마 변경: 스키마 변경이 감지되면 Databand는 이를 대시보드에 표시하고 경고를 보냅니다. 데이터 작업을 하는 사람이라면 누구나 열 추가 또는 제거와 같은 데이터 소스의 스키마 변경이 일어나는 시나리오를 접했을 것입니다. 이러한 변경 사항은 워크플로에 영향을 미치고, 이는 다시 다운스트림 데이터 파이프라인 처리에 영향을 미쳐 파급 효과를 가져옵니다. Databand는 스키마 기록을 분석하고 이상 징후가 있으면 즉시 경고하여 잠재적인 중단을 방지할 수 있습니다.
  • 서비스 수준 계약(SLA) 영향: Databand는 데이터 계보를 표시하고 데이터 파이프라인 오류의 영향을 받는 다운스트림 데이터 파이프라인을 식별합니다. 데이터 전달에 대해 정의된 SLA가 있는 경우 경고는 SLA 준수를 인식하고 유지하는 데 도움이 됩니다.
  • 성능 및 런타임 이상: Databand는 데이터 파이프라인 실행 기간을 모니터링하고 이상 징후를 감지하는 방법을 학습하여 필요할 때 플래그를 지정합니다. 사용자는 파이프라인의 기간을 알 필요가 없습니다. Databand는 과거 데이터를 통해 학습합니다.
  • 상태 : Databand는 실패, 취소 또는 성공 여부를 포함하여 실행 상태를 모니터링합니다.
  • 데이터 유효성 검사: Databand는 시간 경과에 따른 데이터 값 범위를 관찰하고 이상 징후가 감지되면 경고를 보냅니다. 여기에는 평균, 표준 편차, 최소값, 최대값 및 사분위수와 같은 일반적인 통계가 포함됩니다.

향상된 데이터 파이프라인을 위한 혁신적인 Databand 알림

사용자는 복잡하지 않고 워크플로우를 모니터링하고 지원하는 직관적인 대시보드를 갖춘 Databand 사용자 인터페이스를 사용하여 경고를 설정할 수 있습니다. 방향성 비순환 그래프를 통해 심층적인 가시성을 제공하며, 이는 많은 데이터 파이프라인을 처리할 때 유용합니다. 이 올인원 시스템을 통해 지원 팀은 주의가 필요한 영역에 집중하여 결과물을 가속화할 수 있습니다.

IBM Enterprise Data의 인수 및 합병을 통해 우리는 Databand를 통해 데이터 파이프라인을 강화할 수 있었으며 지금까지 뒤돌아보지 않았습니다. 데이터 사고를 조기에 식별하고 더 빠르게 해결하며 기업에 더욱 신뢰할 수 있는 데이터를 제공하는 데 도움이 되는 이 혁신적인 소프트웨어를 제공하게 되어 기쁘게 생각합니다.

지속적인 데이터 관찰성을 통해 신뢰할 수 있는 데이터 제공

Gartner 보고서 읽기

이 글이 도움 되었나요?

가능아니


데이터 및 분석에 대한 추가 정보




IBM의 MongoDB Enterprise Advanced란 무엇입니까?

3 분 읽기 - MongoDB Enterprise Advanced with IBM은 데이터 저장을 위해 유연한 스키마를 사용하는 수평 확장형 아키텍처를 기반으로 구축된 문서 데이터베이스입니다. 2007년에 설립된 MongoDB는 개발자 커뮤니티 내에서 전 세계 팬 기반을 확보했습니다. IT 스프롤 해결: 혁신을 위한 데이터베이스 인프라 최적화 MongoDB는 문서 모델 및 수평 확장성을 통해 전문화를 향한 업계 추세를 촉발하는 데 도움이 되었습니다. 그러나 시간이 지남에 따라 이러한 좁게 전문화된 제품은 더 많은 비용과 복잡성을 초래하는 경우가 많았습니다. 서로 다른 제품을 하나의 제품으로 통합…




Boxes 및 IBM watsonx를 사용하여 소매업 인사이트를 개인화하세요

2 분 읽기 - 나는 7살 때 학교 수업이 끝나고 아버지와 함께 일하기를 간절히 기다리고 있었던 것을 기억합니다. 그는 우루과이의 선구적인 기업가이자 나의 가장 위대한 멘토였으며 브랜드가 진화하는 소비자 행동에 적응하는 데 도움이 되는 자동 판매기를 개발했습니다. 2024년에는 소매 업계에 소비자 수요를 충족하기 위한 현대적인 접근 방식이 다시 한 번 필요합니다. 이것이 바로 제가 소매업체와 소비재(CPG) 회사가 오프라인 매장에서 소비자와 더 잘 소통할 수 있도록 돕기 위해 Boxes를 만든 이유입니다.




엔터프라이즈 AI를 위한 데이터 수집 및 통합의 중요성

4 분 읽기 - 생성적 AI의 출현으로 몇몇 유명 기업에서는 민감한 내부 데이터를 잘못 처리했기 때문에 사용을 제한했습니다. CNN에 따르면 일부 회사는 기술을 더 잘 이해하기 위해 생성 AI 도구에 대한 내부 금지 조치를 취했으며 많은 회사는 내부 ChatGPT 사용도 차단했습니다. 기업에서는 LLM(대형 언어 모델)을 탐색할 때 내부 데이터를 사용하는 위험을 여전히 수용하는 경우가 많습니다. 왜냐하면 이러한 상황별 데이터를 통해 LLM이 범용에서 일반 용도로 변경될 수 있기 때문입니다.




IBM의 새로운 watsonx 대형 음성 모델은 휴대폰에 생성 AI를 제공합니다.

3 분 읽기 - 생성 AI는 놀라운 텍스트 및 이미지 생성 기능과 기업이 핵심 비즈니스 기능을 처리하는 방법에 대한 혁명이라는 약속을 통해 일상 어휘집에 들어왔기 때문에 대부분의 사람들이 대규모 언어 모델(LLM)에 대해 들어본 적이 있을 것입니다. 이제는 채팅 인터페이스를 통해 AI와 대화하거나 AI가 특정 작업을 수행하도록 하는 것이 그 어느 때보다 현실이 되었습니다. 개인으로서 일상 경험에 긍정적인 영향을 미치기 위해 이 기술을 채택하는 데 엄청난 진전이 일어나고 있습니다.

IBM 뉴스레터

새로운 트렌드에 대한 최신 사고 리더십과 통찰력을 제공하는 뉴스레터와 주제 업데이트를 받아보세요.

지금 가입

더 많은 뉴스 레터

spot_img

최신 인텔리전스

spot_img