Logo Zephyrnet

IBM Databand: Tự học để phát hiện sự bất thường – Blog IBM

Ngày:


IBM Databand: Tự học để phát hiện sự bất thường – Blog IBM



Các kỹ sư thảo luận trên bàn trong văn phòng sáng tạo

Gần một năm trước, IBM đã gặp phải sự cố xác thực dữ liệu trong một trong những luồng dữ liệu mua bán và sáp nhập có tính nhạy cảm về thời gian của chúng tôi. Chúng tôi đã phải đối mặt với một số thách thức khi nỗ lực giải quyết vấn đề, bao gồm khắc phục sự cố, xác định sự cố, khắc phục luồng dữ liệu, thực hiện các thay đổi đối với đường dẫn dữ liệu xuôi dòng và thực hiện một quy trình làm việc tự động đặc biệt.

Tăng cường độ phân giải dữ liệu và hiệu quả giám sát với Databand

Sau khi vấn đề trước mắt được giải quyết, một phân tích hồi cứu cho thấy rằng việc xác thực dữ liệu phù hợp và giám sát thông minh có thể giúp giảm bớt khó khăn và đẩy nhanh thời gian giải quyết. Thay vì phát triển một giải pháp tùy chỉnh chỉ dành cho mối quan tâm trước mắt, IBM đã tìm kiếm một giải pháp xác thực dữ liệu có thể áp dụng rộng rãi, có khả năng xử lý không chỉ tình huống này mà còn cả các vấn đề tiềm ẩn bị bỏ qua.  

Đó là khi tôi phát hiện ra một trong những sản phẩm được mua gần đây của chúng tôi, IBM® Databand® để quan sát dữ liệu. Không giống như các công cụ giám sát truyền thống với tính năng giám sát dựa trên quy tắc hoặc hàng trăm tập lệnh giám sát được phát triển tùy chỉnh, Databand cung cấp tính năng giám sát tự học. Nó quan sát hành vi dữ liệu trong quá khứ và xác định những sai lệch vượt quá ngưỡng nhất định. Khả năng học máy này cho phép người dùng giám sát dữ liệu với cấu hình quy tắc tối thiểu và phát hiện bất thường, ngay cả khi họ có kiến ​​thức hạn chế về dữ liệu hoặc các mẫu hành vi của nó.

Tối ưu hóa khả năng quan sát luồng dữ liệu với tính năng giám sát tự học của Databand

Databand xem xét hành vi lịch sử của luồng dữ liệu và gắn cờ các hoạt động đáng ngờ trong khi cảnh báo cho người dùng. IBM đã tích hợp Databand vào luồng dữ liệu của chúng tôi, bao gồm hơn 100 đường ống. Nó cung cấp các cập nhật trạng thái có thể quan sát dễ dàng cho tất cả các lần chạy và đường ống, đồng thời quan trọng hơn là các lỗi được nêu rõ. Điều này cho phép chúng tôi tập trung và đẩy nhanh việc khắc phục sự cố luồng dữ liệu.

Dải dữ liệu cho khả năng quan sát dữ liệu sử dụng khả năng tự học để giám sát những điều sau:  

  • Thay đổi lược đồ: Khi phát hiện thấy thay đổi lược đồ, Databand sẽ gắn cờ thay đổi đó trên bảng điều khiển và gửi cảnh báo. Bất kỳ ai làm việc với dữ liệu đều có thể gặp phải các tình huống trong đó nguồn dữ liệu trải qua các thay đổi về lược đồ, chẳng hạn như thêm hoặc xóa cột. Những thay đổi này tác động đến quy trình công việc, từ đó ảnh hưởng đến quá trình xử lý đường ống dữ liệu xuôi dòng, dẫn đến hiệu ứng gợn sóng. Databand có thể phân tích lịch sử lược đồ và cảnh báo kịp thời cho chúng tôi về bất kỳ điểm bất thường nào, ngăn ngừa sự gián đoạn có thể xảy ra.
  • Tác động của thỏa thuận cấp độ dịch vụ (SLA): Databand hiển thị dòng dữ liệu và xác định các đường ống dữ liệu xuôi dòng bị ảnh hưởng do lỗi đường ống dữ liệu. Nếu có SLA được xác định để phân phối dữ liệu, cảnh báo sẽ giúp nhận biết và duy trì sự tuân thủ SLA.
  • Sự bất thường về hiệu suất và thời gian chạy: Databand giám sát thời gian chạy đường ống dữ liệu và học cách phát hiện các điểm bất thường, gắn cờ chúng khi cần thiết. Người dùng không cần biết thời lượng của quy trình; Databand học từ dữ liệu lịch sử của nó.
  • Tình trạng: Databand theo dõi trạng thái của các lần chạy, bao gồm cả việc chúng bị lỗi, bị hủy hay thành công.
  • Xác nhận dữ liệu: Databand quan sát phạm vi giá trị dữ liệu theo thời gian và gửi cảnh báo khi phát hiện sự bất thường. Điều này bao gồm các số liệu thống kê điển hình như giá trị trung bình, độ lệch chuẩn, mức tối thiểu, tối đa và tứ phân vị.

Cảnh báo Databand chuyển đổi cho đường ống dữ liệu nâng cao

Người dùng có thể đặt cảnh báo bằng cách sử dụng giao diện người dùng Databand, giao diện này không phức tạp và có bảng điều khiển trực quan để giám sát và hỗ trợ quy trình công việc. Nó cung cấp khả năng hiển thị chuyên sâu thông qua các biểu đồ chu kỳ có hướng, rất hữu ích khi xử lý nhiều đường dẫn dữ liệu. Hệ thống tất cả trong một này trao quyền cho các nhóm hỗ trợ tập trung vào các lĩnh vực cần chú ý, cho phép họ đẩy nhanh tiến độ bàn giao.

Việc sáp nhập và mua lại của IBM Enterprise Data đã cho phép chúng tôi nâng cao đường dẫn dữ liệu của mình với Databand và chúng tôi đã không hối hận. Chúng tôi rất vui được cung cấp cho bạn phần mềm biến đổi này giúp xác định sớm hơn các sự cố dữ liệu, giải quyết chúng nhanh hơn và cung cấp dữ liệu đáng tin cậy hơn cho doanh nghiệp.

Cung cấp dữ liệu đáng tin cậy với khả năng quan sát dữ liệu liên tục

Đọc báo cáo của Gartner

Bài viết này hữu ích không?

Không


Thông tin khác từ Dữ liệu và Phân tích




MongoDB Enterprise Advanced với IBM là gì?

3 phút đọcMongoDB Enterprise Advanced với IBM là cơ sở dữ liệu tài liệu được xây dựng trên kiến ​​trúc có thể mở rộng theo chiều ngang, sử dụng lược đồ linh hoạt để lưu trữ dữ liệu. Được thành lập vào năm 2007, MongoDB đã thu hút được lượng người hâm mộ trên toàn thế giới trong cộng đồng nhà phát triển. Giải quyết vấn đề mở rộng CNTT: Tối ưu hóa cơ sở hạ tầng cơ sở dữ liệu cho đổi mới MongoDB đã giúp khơi dậy xu hướng ngành hướng tới chuyên môn hóa với mô hình tài liệu và khả năng mở rộng theo chiều ngang. Tuy nhiên, theo thời gian, những sản phẩm chuyên dụng trong phạm vi hẹp này thường có nhiều chi phí và độ phức tạp hơn. Tích hợp các sản phẩm khác nhau vào một…




Cá nhân hóa thông tin chi tiết về bán lẻ với Boxes và IBM watsonx

2 phút đọcTôi nhớ hồi 7 tuổi, háo hức chờ tan học để cùng bố đi làm. Anh ấy là doanh nhân tiên phong ở Uruguay và là cố vấn vĩ đại nhất của tôi, phát triển máy bán hàng tự động giúp các thương hiệu thích ứng với hành vi ngày càng phát triển của người tiêu dùng. Vào năm 2024, ngành bán lẻ một lần nữa cần một cách tiếp cận hiện đại để đáp ứng nhu cầu của người tiêu dùng. Đó là lý do tại sao tôi tạo ra Boxes để giúp các nhà bán lẻ và công ty hàng tiêu dùng đóng gói (CPG) thu hút người tiêu dùng tốt hơn tại các địa điểm thực tế bằng cách…




Tầm quan trọng của việc nhập và tích hợp dữ liệu đối với AI doanh nghiệp

4 phút đọcSự xuất hiện của Generative AI đã khiến một số công ty nổi tiếng hạn chế sử dụng nó do xử lý sai dữ liệu nội bộ nhạy cảm. Theo CNN, một số công ty đã áp đặt lệnh cấm nội bộ đối với các công cụ AI tổng hợp trong khi họ tìm cách hiểu rõ hơn về công nghệ và nhiều công ty cũng đã chặn việc sử dụng ChatGPT nội bộ. Các công ty vẫn thường chấp nhận rủi ro khi sử dụng dữ liệu nội bộ khi khám phá các mô hình ngôn ngữ lớn (LLM) vì dữ liệu theo ngữ cảnh này chính là thứ giúp LLM có thể thay đổi từ mục đích chung sang…




Mô hình giọng nói lớn watsonx mới của IBM mang AI tổng hợp vào điện thoại

3 phút đọcHầu hết mọi người đều đã nghe nói về các mô hình ngôn ngữ lớn, hay LLM, vì AI tổng quát đã đi vào từ vựng hàng ngày của chúng ta thông qua khả năng tạo văn bản và hình ảnh tuyệt vời cũng như lời hứa của nó là một cuộc cách mạng trong cách doanh nghiệp xử lý các chức năng kinh doanh cốt lõi. Giờ đây, hơn bao giờ hết, ý nghĩ nói chuyện với AI thông qua giao diện trò chuyện hoặc yêu cầu AI thực hiện các nhiệm vụ cụ thể cho bạn đã trở thành hiện thực hữu hình. Những bước tiến to lớn đang diễn ra trong việc áp dụng công nghệ này nhằm tác động tích cực đến trải nghiệm hàng ngày của các cá nhân và…

Bản tin IBM

Nhận các bản tin và cập nhật chủ đề của chúng tôi nhằm cung cấp thông tin chi tiết và lãnh đạo tư tưởng mới nhất về các xu hướng mới nổi.

Theo dõi ngay

Các bản tin khác

tại chỗ_img

Tin tức mới nhất

tại chỗ_img