Zephyrnet-logo

Vijf essentiële gegevensarchitectuurprincipes

Datum:

Principes van gegevensarchitectuur

Principes van data-architectuur zijn een reeks beleidsregels die het dataframework van de onderneming bepalen met zijn operationele regels voor het verzamelen, integreren, gebruiken en beheren van data-assets. Het basisdoel van de Data Architecture-principes is om het ondersteunende dataframework schoon, consistent en controleerbaar te houden. De algemene datastrategie van de onderneming is opgebouwd rond deze principes.

In de afgelopen jaren hebben DA-principes een grote revisie ondergaan om moderne gegevensbeheersystemen, -processen en -procedures te huisvesten. De hedendaagse DA-principes helpen de basis te leggen voor een data-architectuur die sterk geoptimaliseerde bedrijfsprocessen ondersteunt en recente Data Management trends.

OVERWEGENDE EEN CARRIRE IN DATAMANAGEMENT?

Leer meer over de belangrijkste verantwoordelijkheden die je zult hebben en de vaardigheden en opleiding die je nodig hebt met ons online trainingsprogramma.

Hier is een lijst met trends op het gebied van gegevensbeheer die wereldwijde organisaties dwongen om kritisch naar hun bestaande te kijken Data-architectuur:

  • Schakel over van on-premise naar cloudgebaseerde dataplatforms
  • Lagere kosten van streamverwerking, waarbij realtime de voorkeur wordt gegeven boven batchverwerking
  • Vooraf gemaakt commercieel dataplatform vervangen door schaalbare en aanpasbare modulaire oplossingen
  • Hergebruik van gegevens en API's voor gegevenstoegang
  • Verschuiving van data lakes naar op domeinen gebaseerde dataopslag
  • Overschakelen van vooraf gedefinieerde datamodellen naar flexibele dataschema's

Binnen een onderneming wil elke gebruiker schone, gemakkelijk toegankelijke gegevens die routinematig worden bijgewerkt. effectief Gegevensarchitectuur standaardiseer alle gegevensbeheerprocessen voor snelle levering van gegevens aan mensen die het nodig hebben. De bestaande ontwerpen voor gegevensarchitectuur moeten worden gewijzigd om gelijke tred te houden met de veranderende vereisten voor gegevensbeheer.

Als McKinsey-auteur merkt op dat de afgelopen jaren "veel nieuwe en geavanceerde technologieplatforms zijn ingezet naast legacy-infrastructuur" in wereldwijde ondernemingen. Deze nieuwe technologische oplossingen zoals het datameer, het klantanalyseplatform of stroomverwerking hebben een enorme druk uitgeoefend op de prestatiemogelijkheden van de onderliggende data-architectuur. De bestaande data-architectuur is er niet in geslaagd verbeterde ondersteuning te bieden, of heeft zelfs de bestaande data-infrastructuren niet onderhouden.

Bovendien, met de toenemende acceptatie van AI- en ML-platforms voor bedrijfsanalyses en BI-activiteiten, is het tijd voor een revisie van enterprise Data Architecture. Zoals geldt voor elke technologische transformatie, zijn de Data Architecture-principes "ontwikkeld, beproefd en getest" voor de huidige tijd Gegevensarchitectuur zijn behoorlijk verschillend van die van legacy Data Architecture.

In dit bericht worden enkele kernprincipes besproken die een AI-ready, moderne gegevensarchitectuur.

De top vijf essentiële principes van data-architectuur

Terwijl bedrijfsgegevens exponentieel blijven groeien, reageren wereldwijde bedrijven op deze fenomenale groei van gegevens door massale datageletterdheid en Programma's voor gegevensbeheer. Om de maximale bedrijfswaarde uit data te halen, hebben organisaties echter een strategische mindset nodig, samen met geavanceerde technologieën.

Om data als concurrentiemiddel te gebruiken, hebben organisaties zich nu tot fundamentele DA-principes voor antwoorden gewend. De rest van de post zal zich richten op vijf essentiële Data Architecture-principes voor succes met enterprise data-activiteiten:

  • Datakwaliteit (DQ) is het kerningrediënt van een sterke data-architectuur. Datakwaliteit is van cruciaal belang voor het bouwen van een effectieve data-architectuur. Goed beheerde gegevens van hoge kwaliteit helpen bij het bouwen van nauwkeurige modellen en sterke schema's. Gegevens van hoge kwaliteit helpen ook om waardevolle inzichten te verkrijgen. Vaak over het hoofd gezien, is DQ het kernprincipe van een goede data-architectuur. Deze KDNugget-bericht herinnert eraan dat datakwaliteit een van de meest vergeten aspecten van data-architecturen is.
  • Gegevensbeheer (DG) is een kritische factor voor het bouwen van data-architectuur. Nauw verbonden met het bovenstaande principe, regelt het beleid van DG bedrijfsgegevens, ongeacht de bron, het type of het volume. Op elk moment tijdens de levenscyclus van de gegevens moeten gebruikers de locatie, de indelingen, de eigendoms- en gebruiksrelaties en alle andere relevante informatie met betrekking tot de gegevens kennen. Dus, Beleid inzake gegevensbeheer zijn cruciaal voor het succes van data-architectuur omdat ze de taak van een "waakhond" vervullen op het gebied van schaalbaarheid, DQ en compliance.
  • Voor periodieke audits is de herkomst van gegevens noodzakelijk. De herkomst van gegevens is een verzameling informatie over gegevens, die de gegevens van de oorspronkelijke bron tot aan de verwerking volgt. Als gebruikers niet weten hoe gegevens zijn verzameld, opgeschoond en voorbereid, dan zouden ze geen idee hebben van de betrouwbaarheid van de onderliggende data-architectuur.
  • Data in context is een noodzakelijk element. Een onderscheidend kenmerk onderscheidt de ene gegevensentiteit van de andere. Gebruikers moeten eerst de entiteiten begrijpen die in de gegevens bestaan ​​en welke attributen ze van elkaar onderscheiden. Tenzij deze stap is voltooid, zullen gebruikers de context van de gegevens of de rol ervan voor het extraheren van inzichten niet begrijpen. Discriminerende attributen helpen data-architecten om data in context te begrijpen, wat een noodzakelijke stap is voor datamodellering.
  • De granulariteit van details voor elk attribuut moet worden begrepen. Gegevensarchitecten het vereiste detailniveau voor elk attribuut bepalen. De data-architectuur moet elk attribuut op het juiste detailniveau opslaan en ophalen; dus dit is een cruciale stap voor het bouwen van een krachtige data-architectuur.

Hoewel enkele andere DA-principes bijdragen aan het bouwen van een enterprise data-architectuur, valt een discussie hierover buiten het bestek van dit bericht.

Moderne, big data-architecturenprincipes

Elke discussie over data-architecturen zonder big data te noemen, laat zeker een kritisch aspect buiten de discussie. Big data geeft petabytes aan multi-gestructureerde, multi-type data aan die moeten worden beheerd voor een zinvolle analyse. Hier zijn enkele principes voor het bouwen van een moderne Big Data-architectuur:

  • Gecentraliseerd gegevensbeheer: In dit systeem worden alle gegevenssilo's vervangen door een gecentraliseerd overzicht van de bedrijfsgegevens over alle functies heen. Dit type gecentraliseerd systeem ondersteunt ook een 360-gradenoverzicht van klantgegevens met de mogelijkheid om gegevens van verschillende bedrijfsfuncties te correleren.
  • Aangepaste gebruikersinterfaces: Omdat de gegevens centraal worden gedeeld, biedt het systeem meerdere gebruiksvriendelijke interfaces. Het interfacetype is afgestemd op het doel, zoals een OLAP-interface voor BI, een SQL-interface voor analyse of de R-programmeertaal voor datawetenschappelijk werk.
  • Gemeenschappelijke woordenschat voor gegevensgebruik: Een enterprise data hub zorgt voor eenvoudig begrip en analyse van de gedeelde gegevens door middel van een gemeenschappelijk vocabulaire. Dit algemene vocabulaire kan productcatalogi, kalenderdimensies of KPI-definities omvatten, ongeacht het type verbruik of het type gebruik van de gegevens. Het gemeenschappelijke vocabulaire verwijdert onnodige geschillen en verzoeningspogingen.
  • Beperkte gegevensverplaatsing: Frequente databewegingen hebben een grote impact op kosten, nauwkeurigheid en tijd. De cloud- of Hadoop-platforms bieden hiervoor een oplossing; ze ondersteunen beide multi-workload-omgevingen voor parallelle verwerking van datasets. Dit type architectuur maakt dataverplaatsingen overbodig, waardoor de kosten en tijdinvesteringen worden geoptimaliseerd.
  • Gegevensbeheer: Gegevensbeheer is een absolute must om gebruikersfrustraties te verminderen met gegevenstoegang die is opgeslagen in clusters. Stappen voor gegevensbeheer, zoals het opschonen van onbewerkte gegevens, relatiemodellering, het instellen van dimensies en maatregelen, kunnen de algehele gebruikerservaring verbeteren en helpen de maximale waarde uit de gedeelde gegevens te halen.
  • Functies voor systeembeveiliging: Gecentraliseerde gegevensbeheerplatforms zoals Google BigQuery of Amazon Redshift vereisen een strikt beveiligings- en toegangscontrolebeleid voor onbewerkte gegevens. Tegenwoordig maken veel technologische oplossingen data-architecturen mogelijk met ingebouwde beveiliging en zelfbedieningsfuncties zonder de toegangscontrole in gevaar te brengen.

Bovenstaande Data Architectuur principes kunnen de effectiviteit van een Big Data Architectuur aanzienlijk vergroten. Voor meer informatie, wil je misschien wat bekijken DA-best practices.

Afbeelding gebruikt onder licentie van Shutterstock.com

spot_img

VC Café

VC Café

Laatste intelligentie

spot_img