Zephyrnet-logo

Stamgegevens versus referentiegegevens – DATAVERSITY

Datum:

yelosmiley / Shutterstock

De termen ‘stamgegevens’ en ‘referentiegegevens’ kunnen vrij gemakkelijk met elkaar worden verward. Beide bieden gegevens die slechts af en toe in de loop van de tijd veranderen en bieden gegevens die zijn ontworpen om nauwkeurig en actueel te zijn. 

Stamgegevens bieden de nauwkeurige informatie die nodig is voor zakelijke transacties die van cruciaal belang zijn voor het runnen van een bedrijf: de permanente/semi-permanente informatie over klanten, werknemers en leveranciers, en de producten en activa van de organisatie. 

Referentiegegevens daarentegen zijn doorgaans langetermijngegevens (maar niet altijd) en worden gebruikt bij het definiëren en classificeren van ‘andere’ gegevens.

De verwarring wordt overdreven door softwareplatformrecensies met titels die zich richten op referentiegegevens, maar vervolgens verschuiven naar het beschrijven van master data management (MDM)-platforms, waarbij slechts een of twee van de platforms referentiegegevens ondersteunen.

Er bestaat geen gestandaardiseerde definitie voor referentiegegevens. (Voor een beter begrip van referentiegegevens kunt u het referentiegedeelte in uw openbare bibliotheek raadplegen.) 'Andere' langetermijngegevens bestrijken een breed scala aan behoeften en sectoren. In de financiële sector zijn referentiegegevens bijvoorbeeld een verzamelnaam voor gedetailleerde informatie die tijdens transacties wordt gebruikt dynamische referentiegegevens. De referentiegegevens over de groei van kinderen, ontwikkeld door de Wereldgezondheidsorganisatie, geven een ander voorbeeld: ze gebruiken statische referentiegegevens. Een kleine greep uit de verscheidenheid aan referentiegegevenstypen omvat:

Stamgegevens bieden de basisinformatie die nodig is voor zakelijke transacties en vereisen mogelijk beperkte toegang om veiligheidsredenen. Referentiegegevens bieden aanvullende informatie die het bedrijf helpt efficiënter te werken, en zijn vaak gemakkelijk toegankelijk voor al het personeel.

Referentiegegevens en stamgegevens moeten zowel accuraat als actueel zijn.  

Organisaties kunnen referentiegegevens op een aantal locaties opslaan. Als de software dit ondersteunt, kunnen referentiegegevens worden opgeslagen in datacatalogi, databeheersoftware en masterdatabeheerplatforms. Daarnaast zijn er enkele softwareprogramma's die specifiek zijn voor referentiegegevens. In sommige omstandigheden, zoals bij gebruik van een datawarehousekunnen referentiegegevens worden ingesteld als een onderverdeling van stamgegevens. 

Wat is Referentie data?

Referentiegegevens zijn afkomstig uit verschillende bronnen en moeten worden beheerd om de synchronisatie van de bedrijfssystemen te ondersteunen. Een efficiënte methode om dit te doen is het gebruik van een data governance-platform dat datareferentiesoftware omvat. Zonder dit type beheer kunnen referentiegegevens dat wel zijn in silo's binnen een afdelingsorganisatie. Het kan ook anders worden gedefinieerd en beheerd als verschillende afdelingen hun eigen tactieken gebruiken voor het verzamelen en opslaan van referentiegegevens. Voorbeelden van veelgebruikte referentiegegevens zijn onder meer:

  • Transactiecodes
  • Taken en bedrijfsprocessen
  • Financiële hiërarchieën
  • Klantsegmentatie
  • Valuta-informatie
  • Staats- of landcodes
  • Typen organisatie-eenheden
  • Taalcodes
  • kostenplaatsen

Referentiegegevens kunnen uit zowel publieke als private bronnen worden gehaald en leveren informatie aan verschillende domeinen. Vanwege de complexe verbindingen tussen de domeinen en applicaties die referentiegegevens ondersteunen, kan het beheer ervan enkele uitdagingen met zich meebrengen. Het beheren van referentiegegevens mag niet handmatig worden gedaan. Referentiegegevens worden doorgaans door elke afdeling in de organisatie gebruikt om context aan hun gegevens te geven. Het ondersteunt data kwaliteit en bruikbaarheid van gegevens. 

Referentiegegevens vormen een basis voor het gegevensinterpretatieproces dat in verschillende toepassingen, systemen en processen wordt gebruikt.

Het primaire doel van referentiegegevens is het vaststellen van gemeenschappelijke definities, classificaties en relaties voor gegevenselementen. Het maakt ook gebruik van vooraf gedefinieerde codes en waarden. Door dit te doen, verbeteren referentiegegevens de kwaliteit van de gegevens en stroomlijnen ze het gegevensintegratieproces. Dit vereenvoudigt op zijn beurt het delen van gegevens.

De financiële sector maakt bijvoorbeeld gebruik van beveiligingsidentificatoren, zoals Internationale effectenidentificatienummers (ISIN) of ticker symbolen die referentiegegevens communiceren die financiële instrumenten identificeren - obligaties, aandelen en derivaten. Tijdens e-commerce kan het gebruik van productcodes en categorisering het gestandaardiseerde voorraadbeheer en de prijsstelling veel eenvoudiger maken. In de gezondheidszorg helpen medische coderingssystemen bij het nauwkeurig classificeren en factureren van medische diensten.

Masterdata en masterdatabeheer Uitleg

Er zijn twee soorten masterdatabeheer ontwikkeld: analytisch en operationeel. Operationeel masterdatamanagement beschrijft de kerngegevens die een organisatie gebruikt om zaken te doen. Deze gegevens moeten accuraat en betrouwbaar zijn om transactie- en leveringsproblemen te voorkomen en een soepele bedrijfsstroom te ondersteunen.

Analytische masterdatamanagementsystemen gebruiken masterdata om problemen te voorkomen die voortkomen uit conflicterende en overtollige informatie. Zonder het gebruik van masterdata zullen verschillende afdelingen hun eigen versies van masterdata ontwikkelen, wat resulteert in meerdere lijsten, waarbij fouten binnensluipen.

Om masterdata beter te begrijpen, moet u bedenken wat masterdata niet zijn. 

  • Het zijn geen transactiegegevens: Transactiegegevens worden gegenereerd door de verschillende applicaties die de dagelijkse verkoop- en aankoopprocessen van het bedrijf ondersteunen. Hoewel deze informatie wordt vastgelegd en opgeslagen, worden transactiegegevens niet op regelmatige basis gebruikt.
  • Het zijn geen ongestructureerde gegevens: Vrije vorm of ongestructureerde gegevens is noch georganiseerd, noch geformatteerd. Vrije vormgegevens bestaan ​​uit ongestructureerde tekst, cijfers, datums en feitelijk alle gegevens die niet zijn opgemaakt/getransformeerd om met het systeem van de organisatie te werken. Ongestructureerde gegevens kunnen de geschreven inhoud van webpagina's of documenten, e-mails, enquêtes, tijdschriftartikelen, marktonderzoek, enz. omvatten.

Met de juiste software kan masterdatamanagement een breed scala aan diensten bieden, zoals dataopschoning, datatransformatie en data-integratieprocessen. Naarmate er nieuwe gegevensbronnen worden toegevoegd, wordt de software voor masterdatabeheer kan nieuwe gegevens identificeren, verzamelen, transformeren en integreren in het masterdatasysteem. 

Voorbeelden van normaal gebruikte stamgegevens vindt u hieronder:

  • Klantgegevens: Algemeen beschouwd als de meest gebruikte vorm van masterdata, omvatten de basisklantgegevens factuuradressen, e-mailadressen en telefoonnummers, maar zijn ze uitgegroeid tot individuele winkelvoorkeuren op basis van eerdere aankopen.
  • Productgegevens: Dit soort gegevens bevat alle informatie die nodig is om het ontwerp, de productie, de levering en het onderhoud van de producten van een bedrijf te ondersteunen. Productgegevens omvatten de technische specificaties, tekeningen, onderdelen en samenstellingen. Het kunnen ook de facturen van materialen, werkinstructies en goedgekeurde leveranciers zijn.
  • Gegevens van medewerkers: Deze gegevens zouden niet voor al het personeel beschikbaar moeten zijn, maar slechts voor een select aantal. Het omvat doorgaans het burgerservicenummer en de directe stortingsrekening van een werknemer, die privé moeten worden gehouden. Informatie zoals hun huisadres, telefoonnummer en nabestaanden kunnen ook worden vermeld.
  • Aankopen: Gegevens over grote aankopen en specifieke aandelentransacties kunnen als hoofdgegevens worden vermeld.
  • Gegevens vestigingslocatie: De locaties van filialen, winkels, faciliteiten en franchises zijn permanente/semi-permanente informatie en worden regelmatig gebruikt.

Masterdata, gecombineerd met masterdatamanagement, kunnen worden gebruikt ter ondersteuning van data-analyse. Masterdata wordt vaak gebruikt bij analyses, deels omdat deze betrouwbaar, consistent en betrouwbaar zijn. Een bedrijf dat meerdere systemen gebruikt om de gegevens van zijn klanten op te slaan, loopt bijvoorbeeld het risico dat elk systeem met verschillende versies van die gegevens werkt en een analyse verpest die de gegevens van de verschillende systemen combineert.

Verschillende organisaties geven er de voorkeur aan toegang beperken van de masterdata aan een klein aantal geschikte medewerkers – om veiligheidsredenen – terwijl referentiegegevens beschikbaar worden gemaakt voor iedereen in de organisatie.

Datawarehouses, stamgegevens en referentiegegevens

Een datawarehouse is een vorm van gegevensbeheer en -opslag die is ontworpen om analyses en de ontwikkeling ervan te ondersteunen business intelligence. Bovendien kan het worden gebruikt om zowel stamgegevens als referentiegegevens op te slaan. Datawarehouses zijn schaalbaar en eenvoudig uit te breiden. Naarmate een bedrijf groeit, nemen de behoeften aan gegevensopslag toe, inclusief de behoefte aan een groeiende hoeveelheid masterdata en referentiegegevensopslag. Datawarehouses maken deze groei mogelijk.

Datawarehouses kunnen een verscheidenheid aan taken uitvoeren, waaronder de ontwikkeling van business intelligence, en ze zijn vooral nuttig voor het analyseren van aanzienlijke hoeveelheden gegevens over langere perioden.

Analytisch masterdatabeheer kan worden gecoördineerd met een datawarehouse waar het de gegevens centraliseert en consolideert. Gegevens stromen vanuit verschillende bronnen naar het datawarehouse, waaronder gegevens verzameld van externe sites, interne transactiegegevens, operationele mastergegevens en referentiegegevens. Met dit proces kunnen organisaties waardevolle inzichten uit hun gegevens halen.

Referentiegegevens kunnen worden opgeslagen in een datawarehouse, doorgaans als een onderverdeling van de stamgegevens. Datawarehouses ordenen de gegevens vaak met behulp van een ster- of sneeuwvlokschema, met een centrale ‘feitentabel’ die de primaire gegevens bevat, en aanvullende ‘dimensietabellen’ die referentiegegevens bevatten die betrekking hebben op de primaire gegevens. In een datawarehouse voor banken kan de feitentabel bijvoorbeeld bankgegevens bevatten, zoals het bedrag van een lening, de datum waarop de lening is verstrekt en de klant die de lening heeft ontvangen, terwijl de dimensietabellen (referentiegegevens) informatie over productinformatie, demografische klantgegevens en locatiegegevens.

spot_img

Laatste intelligentie

spot_img