Zephyrnet-logo

Trends in datamodellering in 2024 – DATAVERSITY

Datum:

Verwacht een toename van bedrijfsgestuurde en elegante datamodellering – de plannen en activiteiten rond de vereisten voor het maken van diagrammen data-architectuur. Deze trends op het gebied van datamodellering zullen aan kracht winnen naarmate de budgetten voor nieuwere projecten afnemen en er verbeteringen nodig zijn Datakwaliteit toenemen, omdat de oplossing voor elk data-incident is toegenomen tegen 15 uur tussen 2022 en 2023.

Belanghebbenden schreeuwen om rendement van AI na zware investeringen, waardoor bedrijfsgerichte datamodellering van cruciaal belang werd. Het hebben van betrouwbare en beheerde gegevens waarmee AI kan leren en aanbevelingen kan doen, wordt in veel bedrijven de hoogste prioriteit.

Nu leidinggevenden en bedrijven in 2024 opnieuw naar datamodellering kijken, zullen zij veranderingen eisen ten opzichte van de oudere aanpak, die alle fysieke systemen in organisaties behelst vanuit een bedrijfscomponentperspectief. Een datamodel dat vastzit op het fysieke niveau, met veel details, zal in 2024 steeds vaker geen waarde vinden.

In plaats daarvan zullen bedrijven aangepaste modellen van een specifiek product of dienst willen en bezitten en elegante datamodellen creëren om antwoorden te geven op zakelijke vragen. Deze vereisten zullen duidelijk worden met de zes datamodelleringstrends die hieronder worden beschreven.

Een wildgroei aan branchespecifieke modellen 

Zoals Peter Aiken, een erkende Data Management (DM) autoriteit en universitair hoofddocent aan de Virginia Commonwealth University, benadrukt: datamodellen bepalen wat er gebouwd moet worden en hoe. Om tot de relevante oplossing te komen, scherpen bedrijven hun domeingegevens aan ontologisch context die informatie bevat over het gedrag van entiteiten en de relaties daartussen. Industriespecifieke modellen pakken deze focus aan.

Kennisvelden, zoals financiën, geneeskunde of recht, komen tot uiting verschillende nuances die nodig zijn om te voldoen aan toezichthoudende instanties en toezichthouders op dat gebied. Bovendien heeft elke sector specifieke, consistente terminologie en concepten die nodig zijn om zaken te doen. Bedrijven moeten deze subtiliteiten vastleggen via kant-en-klare datamodellen en sjablonen, die direct beschikbaar zijn om toe te passen op componenten van de dataarchitectuur. 

Op die manier besparen organisaties tijd bij het opnieuw creëren van standaard datamodel-entiteiten en -relaties die essentieel zijn voor hun bedrijfssectoren. In plaats daarvan kunnen ze meer tijd besteden aan het begrijpen van en overeenstemming bereiken over het modelleren van hun specifieke diensten en het definiëren ervan bedrijfsregels.

Deze trend naar sectorspecifieke modellen zal tot 2024 en daarna snel toenemen, omdat bedrijven een efficiëntere manier willen toegang real-time en batch-verwerkte gegevens zonder onnodig extra werk. Bovendien, zoals organisaties adopteren data mesh-architectuur en domeinteams zich te concentreren op de data-architectuurcomponenten waarvan zij eigenaar zijn, zal het gebruik van vooraf gedefinieerde branchespecifieke modellen aantrekkelijker worden en het in handen nemen van data toegankelijker maken.

Een toenemend gebruik van conceptuele modellering 

Met een focus op domeingebaseerde datamodellering en een hernieuwde interesse in het verbeteren van de datakwaliteit zullen organisaties zich steeds meer richten op conceptuele modellen. Conceptuele modellen beschrijven welke entiteiten bestaan ​​en hun relaties, en vormen de focus en reikwijdte van een data-architectuurcomponent.

Door een conceptueel datamodel uit te werken, zullen bedrijfs- en technologieteams elkaar betrekken bij het ontwikkelen van een gedeeld vocabulaire en afstemming over welke data-infrastructuur moet worden bijgewerkt of gebouwd. Idealiter zullen bedrijven een logisch datamodel invoeren om de implementatie van de overeengekomen conceptualisering te formaliseren; Door de druk om resultaten te boeken zullen veel bedrijven in 2024 echter proberen minder tijd te besteden aan het werken met logische modellen.

Grotere populariteit van kennisgrafieken

Hoewel gegevensmodellering vele formaten aanneemt, blijven er entiteitsrelatie- (ER), relationele en gegevensstroomdiagrammen (DFD) over Populair, verwacht te zien kennis grafieken, visualisaties van entiteiten en hun relaties komen bovenaan de lijst te staan. Bedrijven worden geconfronteerd met een korter tijdsbestek om bruikbare datamodellen te krijgen, willen onmiddellijke inzichten en kunnen omgaan met steeds meer ongestructureerde data. 

Kennisgrafieken bieden de hulpmiddelen om aan alle drie de vereisten te voldoen. Vooral geweldig voor conceptuele gegevens modellering geven kennisgrafieken inzicht in de oplossing die moet worden gebouwd, gerelateerde en relevante factoren waarmee rekening moet worden gehouden, en omvatten metadata en de context rond de gegevens. Bovendien houdt een kennisgrafiek de veranderingen bij naarmate de gegevens en metadata evolueren.

Volgens Juan Sequeda, hoofdwetenschapper en hoofd van het AI Lab bij data.world, vereenvoudigen kennisgrafieken complexe concepten in één oogopslag door het geven van “rijke, betekenisvolle context en verbindingen tussen datasets.” Deze voordelen leiden tot sneller gegenereerde en relevantere datamodellen.

Bovendien vinden werknemers kennisgrafieken eenvoudig te bouwen. Deze tools zijn te vinden in veel databasebeheersystemen (DBMS's) en andere apps conceptuele modellen Dit zal het gebruik van kennisgrafieken na 2024 nog verder stimuleren.

Betere zelfbedieningsmogelijkheden

Met de proliferatie van branchespecifieke modellen en het toegenomen gebruik van conceptuele datamodellen zullen zakenmensen betere zelfbedieningsmogelijkheden gebruiken en eisen om te experimenteren met datamodellen door middel van interactieve visualisaties en een proactieve rol te spelen in gesprekken met technologieteams. Bovendien zal de gemakkelijke toegang tot datasets via cloud computing en de druk om tijdiger en beter geïnformeerde beslissingen te nemen op basis van realtime data bedrijven ertoe aanzetten datamodellen on-the-fly te updaten en te creëren zonder eerst technologieteams te raadplegen.

Met betere zelfbedieningsmogelijkheden zullen zakenmensen hun initiatief vergroten bij het herhalen van bestaande datamodellen en het bespreken en prioriteren van vereisten. Voortdurende verbeteringen op het gebied van AI en machine learning (ML) zullen het datamodelleringsproces voor bedrijven vereenvoudigen door gemakkelijk aanbevelingen te doen over verborgen relaties binnen de data en nieuwe inzichten daarover.

Bijgevolg zullen analisten en andere dataconsumenten met een goed begrip van hun data volledig deelnemen aan datamodellering, zelfs als ze geen formele training hebben genoten. Daartoe zullen bedrijven hun interesse in betrouwbare en beheerde data-assets vergroten om data goed te kunnen modelleren.

Naarmate bedrijven van zakenmensen leren over hun zelfbedieningsactiviteiten en -processen voor datamodellering, zullen deze organisaties snellere, betere en relevantere tools willen om hun werknemers te helpen bij het aanpassen van modellen. Verwacht dus dat de zelfbedieningstools voor datamodellering in 2024 en daarna zullen verbeteren.

Frequentere real-time gegevensmodellering voor mijnprocessen

Organisaties zullen real-time datamodellering gebruiken om gegevens te verwerken en analyseren terwijl deze worden verbruikt, om hun activiteiten in de toekomst beter te begrijpen en te stroomlijnen. Om dit te doen, zullen bedrijven datamodellen creëren om hun bedrijf te ontwerpen digitale tweeling, die de exacte status, informatie en organisatie van hun productielijn of services weergeeft, zodat AI en ML processen voor verbetering kunnen aanbevelen.

Verwacht dit process mining, waarbij apps en talent worden gebruikt om transactiesysteemgebeurtenissen in het bedrijf te analyseren, regelmatiger voor te komen als onderdeel van het dagelijkse onderhoud en om de kosten te verlagen. Deze groeiende trend zal op vijf manieren invloed hebben op datamodellering voor process mining:

  • Grotere vraag van bedrijven die marktleider zijn naar datamodelbouwers die coderen, datamodellen bouwen, raadplegen, vereisten begrijpen, de verbetering van processen implementeren en ondersteunen
  • Meer tijdreeksanalyse om patronen uit eerdere gegevensstromen bloot te leggen en voorspellingen te doen over hoe u de bedrijfsresultaten kunt verbeteren
  • Verhoogde eisen voor tijdreeksen Gegevensmodellering en visualisaties voor AI en ML om fluctuaties in de gegevensstroom te detecteren, ervan te leren en aanbevelingen te doen
  • Kortere tijdsbestekken voor het maken en leveren van datamodellen en snellere feedbackloops voor datamodellering
  • Soepeler datamodellering, door te focussen op JSON-opslagformaten, om data op een zelfbeschrijvende manier te structureren voor zakelijk inzicht

Meer gezamenlijke datamodelleringssessies via data governance 

Met het toegenomen gebruik van AI en ML worden betrouwbare en beheerde gegevens zal in 2024 een nieuwe noodzaak worden. Gezamenlijke datamodelleringssessies zullen steeds meer als leidraad dienen Gegevensbeheer om deze doelstellingen te bereiken, vooral met AI- en ML-projecten.

Verwacht dat data-architecten, bedrijfsanalisten, ingenieurs en datawetenschappers deze Data Governance-sessies zullen gebruiken om zakelijke vereisten en definities op één lijn te brengen en te begrijpen via het Data Modeling-proces. Dit gezamenlijke inspanning bij het creëren van visualisaties van data-entiteiten, relaties en stromen zal proberen de complexiteit en prioriteiten op het gebied van inzichten, toegang en naleving van de wetgeving aan te pakken. 

Bovendien zal metadatabeheer, de motor die zorgt voor effectieve actie op het gebied van informatie en context, dat wel doen blijven groeien als een belangrijke doelstelling in Data Governance, stijgend ten opzichte van de 66% die werd geïdentificeerd in een Trends in Data Management-onderzoek uit 2022. Datamodellering zal dus metadatabeheerprocessen integreren om de vindbaarheid van gegevens te verbeteren en overeenstemming te bereiken over welke gedeelde gegevensactiviteit vervolgens moet worden aangepakt voor toegang of beveiliging.

Door voort te bouwen op zakelijke gesprekken met technische mensen beloven de vooruitgang op het gebied van automatisering en ML meer significante inzichten te bieden in deze gezamenlijke Data Governance- en Data Modeling-sessies. Ook zullen bedrijven de doelstellingen van Data Modeling en Data Governance integreren in hun technologieplatforms. Deze mogelijkheden zullen sneller realistische datamodellen genereren tijdens een Data Governance-sessie, waardoor mogelijk de tijd wordt verbeterd om problemen met de toegankelijkheid van data of beveiligingsproblemen te herkennen en op te lossen.

Conclusie

Organisaties zullen hun interesse en praktijk in datamodellering hernieuwen vanwege budgettaire en datakwaliteitsproblemen. Bovendien zal datamodellering in 2024 en daarna zakelijker en eleganter worden.

Bedrijven zullen een meer modulaire aanpak hanteren bij het modelleren van data, waarbij ze het totaalbeeld van elke component uitwerken door een grotere focus op conceptuele modellering. De druk op een snelle doorlooptijd zal de vraag naar branchespecifieke modellen, kennisgrafieken en zelfbedieningsmodellen doen toenemen.

Naast ML en AI zal datamodellering in nieuwere omgevingen steeds meer terrein winnen. Het zal de bedrijfsactiviteiten en de operationele veranderingen informeren die nodig zijn om deze in de toekomst beter te laten verlopen. Bovendien zal Data Modeling een steeds grotere rol gaan spelen bij het omgaan met Data Governance-problemen rond data-analyse en -beveiliging.

Bovendien zullen de processen, tools, automatisering en ML van datamodellering in 2024 vooruitgaan, en zullen ook de mogelijkheden om datamodellen direct aan te passen en te genereren toenemen. Naarmate datamodellen beter reageren op de zakelijke eisen en betere ML-resultaten bevorderen, kunt u verwachten dat meer zakenmensen betrokken zullen worden bij datamodelleringsactiviteiten en -gesprekken.

Afbeelding gebruikt onder licentie van Shutterstock

spot_img

Laatste intelligentie

spot_img