Zephyrnet-logo

Wat zijn dataproducten en waarom zijn ze belangrijk? – DATAVERSITEIT

Datum:

Dataproducten zijn software in de vorm van speciale tools en apps die zijn ontworpen om gegevens te ondersteunen die als service worden gebruikt. Ze kunnen zo eenvoudig en ongecompliceerd zijn als een programma dat een dataset omzet in een visualisatie, of zo complex als een machine learning-systeem gebaseerd op grote taalmodellen (LLM), zoals ChatGPT. Wat alle dataproducten gemeen hebben is dat ze door de toepassing van data een specifiek doel bereiken.

Een potentieel verwarrend aspect van de technologie is het onderscheid tussen dataproducten en ‘gegevens als een product”, dat datatools combineert met strategieën om te voldoen aan de behoeften van specifieke dataconsumenten, of het nu gaat om één persoon of een hele afdeling of organisatie. Dataproducten dienen daarentegen als de grondstof die bedrijven op unieke manieren kunnen combineren om strategieën te implementeren om hun korte- en langetermijndoelen te bereiken. Ze opereren op het niveau van individuen, teams, afdelingen, bedrijven en hele industrieën.

Wat is een Gegevensproduct?

AI en andere snelgroeiende technologieën stellen organisaties in staat inzichten uit hun datamiddelen te halen op manieren die de waarde van de data maximaliseren. Dataproducten dienen als het middel waarmee bedrijven data omzetten in acties die hun efficiëntie, concurrentievermogen en winstgevendheid verbeteren. Voormalig hoofd datawetenschapper van de VS DJ Patil bedacht de term "gegevens jiujitsu” in 2012 als “de kunst van het omzetten van data in producten.” 

Door de slimme toepassing van data-elementen maakt data-jiujitsu het mogelijk dat anderszins hardnekkige iteratieve dataproblemen worden opgelost door het ‘gewicht’ van het probleem tegen zichzelf te gebruiken, net zoals jiujitsu-strijders proberen het gewicht van hun tegenstanders in hun voordeel en in het nadeel van hun vijanden te gebruiken. . De standaard probleemoplossende aanpak, waarbij het frontaal wordt aangepakt met behulp van verschillende technische expertises, compliceert het probleem vaak en maakt het moeilijker om het op te lossen.

Het doel van dataproducten is om het oplossen van problemen te vereenvoudigen door vanaf het begin een eenvoudige vraag te beantwoorden: wie wil of heeft dit product nodig? Om deze vraag snel te beantwoorden, nemen ontwikkelaars snelkoppelingen die de voltooide versie kunnen halen, of later in het proces worden vervangen door ingewikkelder benaderingen. De sleutel is om eenvoudig te beginnen, om te voorkomen dat u aan het begin van het project vastloopt.

Componenten van dataproducten

Zelfs de eenvoudigste dataproducten bestaan ​​uit een gevarieerde lijst van elementen die samen beslissingen ondersteunen en bedrijfsproblemen oplossen. Dit zijn de acht sleutelcomponenten van een dataproduct:

  • Data bronnen moet betrouwbaar zijn, in realtime of in batches toegankelijk zijn, relevant zijn voor het probleem dat wordt opgelost en in overeenstemming zijn met de regelgeving inzake gegevensbescherming, zoals GDPR en HIPAA, evenals met wettelijke en ethische normen.
  • Gegevenspijplijnen automatiseer alle vereiste dataconversies (ETL), schaalbaar om groeiende datasets te accommoderen, omvatten robuuste tools voor foutafhandeling en gegevenskwaliteitscontroles, en zijn modulair om configuratiewijzigingen te ondersteunen.
  • Gegevensopslag moeten voldoen aan prestatie-eisen, horizontaal en verticaal schalen zonder verstoring, encryptie en toegangscontroles toepassen, en kosteneffectief zijn en tegelijkertijd gestructureerde, semi-gestructureerde en ongestructureerde datatypen ondersteunen.
  • Datamodellen en algoritmen nauwkeurige inzichten en voorspellingen bieden die zijn gevalideerd met behulp van technieken zoals kruisvalidatie. Ze moeten voor belanghebbenden gemakkelijk te begrijpen, rekenefficiënt en gemakkelijk te onderhouden zijn.
  • De gebruikersinterface moet intuïtief genoeg zijn om minimale gebruikerstraining te vereisen. Het moet gebruik maken van visualisaties en de interactie van gebruikers met de gegevens vergemakkelijken, inclusief feedbackmechanismen en ondersteuning voor meerdere apparaten.
  • API's en eindpunten vereisen veilige autorisatie en authenticatie, limieten op het aantal API-aanroepen van elke gebruiker of systeem, en voldoende ontwikkelaarsdocumentatie. Ze moeten gegevensformaten ondersteunen zoals JSON en XML om compatibiliteit te garanderen.
  • Bewaken en loggen in realtime zorgt ervoor dat dataproducten problemen snel kunnen identificeren en aanpakken. Beheerders worden gewaarschuwd voor prestatieproblemen en fouten, en audittrails helpen bedrijven om aan de compliance-eisen te voldoen. Prestatiestatistieken die moeten worden bewaakt, zijn onder meer latentie, doorvoer en foutpercentages.
  • Documentatie omvat gebruikershandleidingen, technische specificaties, documentatie voor API's, wijzigingslogboeken en nalevingsgegevens.

Voorbeelden van dataproducten

Het meest populaire voorbeeld van een dataproduct is misschien wel ChatGPT, de gratis op AI gebaseerde tool die eenvoudige en complexe vragen op een gemoedelijke manier beantwoordt en een dialoog aangaat met gebruikers die vervolgvragen mogelijk maakt, fouten toegeeft en onnauwkeurigheden uitdaagt. ChatGPT kwalificeert als een dataproduct omdat het afhankelijk is van a zeer grote tekstdataset, hoewel het systeem veel complexer is dan typische dataproducten. 

In de huidige staat mist ChatGPT echter één belangrijk aspect van dataproducten: nauwkeurigheid. De eigenaar van het dataproduct is verantwoordelijk voor het garanderen van zowel een positieve gebruikerservaring als een betrouwbare oplossing voor het probleem waarvoor het product is ontworpen. Dit vereist best practices op het gebied van productbeheer en consistente en betrouwbare toegang tot analyses die zakelijke beslissingen ondersteunen.

Deze zes categorieën dataproducten demonstreer het gebruik van de technologie in alledaagse producten:

  • Aanbevelingsmotoren aangeboden door bedrijven als Amazon, Netflix en TripAdvisor personaliseren hun reacties om de klantbetrokkenheid te vergroten en de conversiepercentages te verbeteren.
  • Voorspellende analysetools omvatten die gebruikt door FICO, LinkedIn en Zillow die trends in gegevens identificeren en voorspellingen genereren op basis van geavanceerde datamining- en modelleringstechnieken.
  • Gegevens-API's zoals Google Maps, LinkedIn Profiles en IO Weather vergemakkelijken de soepele gegevensstroom tussen ongelijksoortige systemen. Veelgebruikte formaten zijn representatieve statusoverdracht (REST), Simple Object Access Protocol (SOAP), XML-RPC en JSON-RPC.
  • Realtime dashboards presenteer gegevens visueel en update de schermen van gebruikers automatisch zodra er nieuwe informatie beschikbaar komt. Ze worden toegepast om voorraad-, verkoop- en operationele gegevens te monitoren ter ondersteuning van zakelijke beslissingen. Populaire dashboards omvatten Tableau, Microsoft BI en Zoho Analytics.
  • Persoonlijke financiën tools omvatten Empower (voorheen Personal Capital), Quicken en You Need a Budget (YNAB), die allemaal proberen meer duidelijkheid en vertrouwen te brengen in de financiële planning van individuen.
  • Draagbare producten voor gezondheidsmonitoring zoals Apple Watch, FitBit en Dexcom’s Continuous Glucose Meter gaan verder dan het volgen van de hartslag, slaappatronen en andere gezondheidskwesties door de informatie te delen met zorgverleners.

Waarom dataproducten belangrijk zijn

Gegevens producten ten goede komen aan dataconsumenten op verschillende manieren:

  • Ze krijgen sneller inzicht door kant-en-klare producten te gebruiken, in plaats van dat ze elk project helemaal opnieuw moeten beginnen.
  • De integriteit van de gegevens wordt vooraf geverifieerd, zodat er vertrouwen in de producten wordt ingebouwd.
  • Real-time situationeel bewustzijn vergroot de waarde van data-analyses.
  • De mogelijkheid om in realtime te reageren ondersteunt sneller geïnformeerde besluitvorming.
  • Het bestuur wordt vergemakkelijkt door voorafgaande garanties van Datakwaliteit en naleving.
  • De producten maken gegevens eenvoudig te vinden en toegankelijk vanuit diverse systemen.

Organisaties zien dataproducten als de sleutel tot grotere efficiëntie en winstgevendheid:

  • Dataproducten helpen de focus van het bedrijf op positieve resultaten te verscherpen.
  • Ze verbeteren de wendbaarheid van organisaties en leveren stapsgewijs waarde op.
  • Hergebruik van dataproducten maximaliseert de waarde van data met zeer weinig overhead.
  • Data-architecturen worden toekomstbestendig gemaakt door het aanpassingsvermogen van dataproducten.
  • Er ontstaan ​​minder vragen over de betrouwbaarheid en integriteit van de onderliggende data.
  • Business- en IT-afdelingen communiceren in dezelfde taal.

Misschien wel het grootste voordeel van dataproducten voor organisaties is hun vermogen om dat te doen ontsluit de waarde van data door te dienen als de lijm die fysieke systemen, datamodellering, bedrijfsprocessen en gebruiksscenario’s met elkaar verbindt. Ze vervangen de fragmentarische aanpak die veel bedrijven hanteren bij hun dataactiviteiten, terwijl ze tegelijkertijd het databeheer decentraliseren. Hierdoor kunnen de onderliggende gegevens direct worden toegepast in uiteenlopende situaties en omstandigheden, met minimale of geen voorbewerking. 

Volgens McKinsey maken dataproducten nieuwe zakelijke toepassingen mogelijk 90% sneller geïmplementeerd en de totale eigendomskosten dalen met 30%. Ze verminderen ook het risico en de tijd en het geld dat wordt besteed aan bestuursactiviteiten.

Het realiseren van de voordelen die dataproducten beloven, vereist het adopteren van een agile benadering van datamanagement dat klein begint, snel wordt vrijgegeven, wordt herhaald en de waarde van het product aantoont. Voeg bij elke release nog een paar mogelijkheden toe om de waarde van het product stapsgewijs te vergroten, de acceptatie te stimuleren en meer investeringen voor nieuwe producten en gebruiksscenario's te genereren. Zodra dataproducten worden geïntegreerd met de dagelijkse bedrijfsprocessen van uw bedrijf, zullen de tools zichzelf gaan verkopen naarmate hun waarde duidelijk wordt voor gebruikers en managers. 

Afbeelding gebruikt onder licentie van Shutterstock

spot_img

Laatste intelligentie

spot_img