Zephyrnet-logo

IBM Databand: zelflerend voor detectie van afwijkingen – IBM Blog

Datum:


IBM Databand: zelflerend voor detectie van afwijkingen – IBM Blog



Ingenieurs bespreken op tafel in creatief kantoor

Bijna een jaar geleden stuitte IBM op een gegevensvalidatieprobleem tijdens een van onze tijdgevoelige gegevensstromen over fusies en overnames. We werden geconfronteerd met verschillende uitdagingen terwijl we werkten aan het oplossen van het probleem, waaronder het oplossen van problemen, het identificeren van het probleem, het repareren van de gegevensstroom, het aanbrengen van wijzigingen in de downstream-datapijplijnen en het uitvoeren van een ad-hocuitvoering van een geautomatiseerde workflow.

Verbetering van de gegevensresolutie en monitoring-efficiëntie met Databand

Nadat het onmiddellijke probleem was opgelost, bleek uit een retrospectieve analyse dat een goede gegevensvalidatie en intelligente monitoring de pijn hadden kunnen verlichten en de tijd tot oplossing hadden kunnen versnellen. In plaats van een oplossing op maat te ontwikkelen uitsluitend voor het directe probleem, zocht IBM naar een breed toepasbare oplossing voor gegevensvalidatie die niet alleen dit scenario aankon, maar ook potentiële over het hoofd geziene problemen.  

Toen ontdekte ik een van onze onlangs aangeschafte producten, IBM® Databand® voor dataobservatie. In tegenstelling tot traditionele monitoringtools met op regels gebaseerde monitoring of honderden op maat ontwikkelde monitoringscripts, biedt Databand zelflerende monitoring. Het observeert gegevensgedrag uit het verleden en identificeert afwijkingen die bepaalde drempels overschrijden. Dankzij deze machine learning-mogelijkheid kunnen gebruikers gegevens monitoren met minimale regelconfiguratie en detectie van afwijkingen, zelfs als ze beperkte kennis hebben over de gegevens of de gedragspatronen ervan.

Optimalisatie van de observatie van datastromen met de zelflerende monitoring van Databand

Databand houdt rekening met het historische gedrag van de gegevensstroom en signaleert verdachte activiteiten terwijl de gebruiker wordt gewaarschuwd. IBM integreerde Databand in onze datastroom, die meer dan 100 pijplijnen omvatte. Het zorgde voor gemakkelijk waarneembare statusupdates voor alle runs en pijplijnen en, nog belangrijker, bracht fouten aan het licht. Hierdoor konden we ons concentreren op het herstel van gegevensstroomincidenten en deze versnellen.

Databand voor waarneembaarheid van gegevens maakt gebruik van zelflerend om het volgende te monitoren:  

  • Schemawijzigingen: Wanneer een schemawijziging wordt gedetecteerd, markeert Databand dit op een dashboard en verzendt een waarschuwing. Iedereen die met gegevens werkt, is waarschijnlijk scenario's tegengekomen waarin een gegevensbron schemawijzigingen ondergaat, zoals het toevoegen of verwijderen van kolommen. Deze veranderingen hebben invloed op de workflows, die op hun beurt de verwerking van de downstream datapijplijn beïnvloeden, wat tot een rimpeleffect leidt. Databand kan de schemageschiedenis analyseren en ons onmiddellijk waarschuwen voor eventuele afwijkingen, waardoor mogelijke verstoringen worden voorkomen.
  • Impact van de Service Level Agreement (SLA): Databand toont de datalijn en identificeert stroomafwaartse datapijplijnen die zijn getroffen door een datapijplijnstoring. Als er een SLA is gedefinieerd voor de levering van gegevens, helpen waarschuwingen bij het herkennen en handhaven van SLA-naleving.
  • Prestatie- en runtime-afwijkingen: Databand bewaakt de duur van datapijplijnruns en leert afwijkingen te detecteren en deze indien nodig te markeren. Gebruikers hoeven zich niet bewust te zijn van de duur van de pijplijn; Databand leert van zijn historische gegevens.
  • Status: Databand bewaakt de status van runs, inclusief of deze zijn mislukt, geannuleerd of succesvol.
  • Gegevensvalidatie: Databand observeert datawaardebereiken in de loop van de tijd en stuurt een waarschuwing bij het detecteren van afwijkingen. Dit omvat typische statistieken zoals gemiddelde, standaarddeviatie, minimum, maximum en kwartielen.

Transformatieve Databand-waarschuwingen voor verbeterde datapijplijnen

Gebruikers kunnen waarschuwingen instellen met behulp van de Databand-gebruikersinterface, die ongecompliceerd is en beschikt over een intuïtief dashboard dat workflows bewaakt en ondersteunt. Het biedt diepgaand inzicht via gerichte acyclische grafieken, wat handig is bij het omgaan met veel datapijplijnen. Dit alles-in-één systeem stelt ondersteuningsteams in staat zich te concentreren op gebieden die aandacht vereisen, waardoor ze de resultaten kunnen versnellen.

De fusies en overnames van IBM Enterprise Data hebben ons in staat gesteld onze datapijplijnen met Databand te verbeteren, en we hebben niet achterom gekeken. We zijn verheugd u deze transformerende software aan te bieden waarmee u data-incidenten eerder kunt identificeren, sneller kunt oplossen en betrouwbaardere gegevens aan bedrijven kunt leveren.

Lever betrouwbare gegevens met continue waarneembaarheid van gegevens

Lees het Gartner-rapport

Was dit artikel behulpzaam?

JaNee


Meer uit Gegevens en analyses




Wat is MongoDB Enterprise Advanced met IBM?

3 min gelezen - MongoDB Enterprise Advanced met IBM is een documentendatabase gebouwd op een horizontaal schaalbare architectuur die een flexibel schema gebruikt voor gegevensopslag. MongoDB, opgericht in 2007, heeft een wereldwijde schare fans verzameld binnen de ontwikkelaarsgemeenschap. IT-wildgroei oplossen: database-infrastructuur optimaliseren voor innovatie MongoDB heeft met zijn documentmodel en horizontale schaalbaarheid geholpen een industriële trend richting specialisatie op gang te brengen. Na verloop van tijd brachten deze nauw gespecialiseerde producten echter vaak meer kosten en complexiteit met zich mee. Het integreren van uiteenlopende producten in één…




Personaliseer retailinzichten met Boxes en IBM Watsonx

2 min gelezen - Ik herinner me dat ik een 7-jarige was en reikhalzend uitkeek naar het einde van de schooldag om bij mijn vader aan het werk te gaan. Hij was een baanbrekende ondernemer in Uruguay en mijn grootste mentor, die verkoopautomaten ontwikkelde die merken hielpen zich aan te passen aan het veranderende consumentengedrag. In 2024 heeft de detailhandel opnieuw behoefte aan een moderne aanpak om aan de vraag van de consument te voldoen. Daarom heb ik Boxes gemaakt om retailers en bedrijven in consumentenverpakkingen (CPG) te helpen consumenten beter te betrekken op fysieke locaties door...




Het belang van gegevensopname en -integratie voor zakelijke AI

4 min gelezen - De opkomst van generatieve AI was voor verschillende vooraanstaande bedrijven aanleiding om het gebruik ervan te beperken vanwege het verkeerd omgaan met gevoelige interne gegevens. Volgens CNN hebben sommige bedrijven interne verboden opgelegd aan generatieve AI-tools terwijl ze proberen de technologie beter te begrijpen, en velen hebben ook het gebruik van interne ChatGPT geblokkeerd. Bedrijven accepteren nog steeds vaak het risico van het gebruik van interne gegevens bij het verkennen van grote taalmodellen (LLM's), omdat deze contextuele gegevens LLM's in staat stellen te veranderen van algemene doeleinden naar ...




IBM's nieuwe watsonx grote spraakmodel brengt generatieve AI naar de telefoon

3 min gelezen - Bijna iedereen heeft wel eens gehoord van grote taalmodellen, oftewel LLM’s, sinds generatieve AI ons dagelijkse lexicon is binnengedrongen dankzij de verbazingwekkende mogelijkheden om tekst en afbeeldingen te genereren, en de belofte ervan als een revolutie in de manier waarop ondernemingen met hun kernactiviteiten omgaan. De gedachte om via een chatinterface met AI te praten of deze specifieke taken voor u te laten uitvoeren, is nu meer dan ooit een tastbare realiteit. Er vinden enorme stappen plaats om deze technologie toe te passen en zo een positieve invloed te hebben op de dagelijkse ervaringen als individu en…

IBM-nieuwsbrieven

Ontvang onze nieuwsbrieven en onderwerpupdates die de nieuwste thought leadership en inzichten over opkomende trends bieden.

Abonneer nu

Meer nieuwsbrieven

spot_img

Laatste intelligentie

spot_img