Logo Zephyrnet

Dati anagrafici e dati di riferimento – DATAVERSITY

Data:

yelosmiley/Shutterstock

I termini “dati anagrafici” e “dati di riferimento” possono essere confusi abbastanza facilmente. Entrambi forniscono dati che cambiano solo occasionalmente nel tempo e forniscono dati progettati per essere accurati e aggiornati. 

I dati anagrafici forniscono le informazioni accurate necessarie per le transazioni commerciali fondamentali per la gestione di un'azienda: informazioni permanenti/semipermanenti su clienti, dipendenti e fornitori, nonché sui prodotti e sulle risorse dell'organizzazione. 

I dati di riferimento, d’altro canto, sono tipicamente a lungo termine (ma non sempre) e utilizzati per definire e classificare “altri” dati.

La confusione è esagerata dalle revisioni delle piattaforme software con titoli che si concentrano sui dati di riferimento, per poi passare alla descrizione delle piattaforme di gestione dei dati master (MDM), con solo una o due piattaforme che supportano i dati di riferimento.

Non esiste una definizione standardizzata per i dati di riferimento. (Per una migliore comprensione dei dati di riferimento, pensa alla sezione di riferimento nella tua biblioteca pubblica.) Gli “altri” dati a lungo termine coprono un’ampia gamma di esigenze e settori. Ad esempio, nel settore finanziario, i dati di riferimento sono un termine generico per informazioni dettagliate utilizzate durante le transazioni dati di riferimento dinamici. I dati di riferimento sulla crescita dei bambini, sviluppati dall'Organizzazione Mondiale della Sanità, forniscono un altro esempio – utilizzando dati di riferimento statici. Un piccolo esempio della varietà di tipi di dati di riferimento include:

I dati anagrafici forniscono le informazioni di base necessarie per le transazioni commerciali e potrebbero richiedere un accesso limitato per motivi di sicurezza. I dati di riferimento forniscono informazioni aggiuntive che aiutano l'azienda a operare in modo più efficiente e sono spesso facilmente accessibili a tutto il personale.

I dati di riferimento e i dati anagrafici devono essere accurati e aggiornati.  

Le organizzazioni possono archiviare i dati di riferimento in diverse posizioni. Se il software lo supporta, i dati di riferimento possono essere salvati in cataloghi di dati, software di governance dei dati e piattaforme di gestione dei dati master. Inoltre, esistono alcuni programmi software specifici per i dati di riferimento. In alcune circostanze, come quando si utilizza a data warehouse, i dati di riferimento possono essere impostati come suddivisione dei dati anagrafici. 

Cosa è Dati di riferimento?

I dati di riferimento provengono da diverse fonti e devono essere gestiti per supportare la sincronizzazione dei sistemi aziendali. Un metodo efficace per farlo è utilizzare una piattaforma di governance dei dati che includa un software di riferimento dei dati. Senza questo tipo di gestione i dati di riferimento potrebbero esserlo in silenzio all'interno di un'organizzazione dipartimentale. Può anche essere definito e gestito in modo diverso se diversi dipartimenti utilizzano le proprie tattiche per raccogliere e archiviare i dati di riferimento. Esempi di dati di riferimento comunemente utilizzati includono:

  • Codici di transazione
  • Compiti e processi aziendali
  • Gerarchie finanziarie
  • Segmentazione del cliente
  • Informazioni sulla valuta
  • Codici di stato o paese
  • Tipi di unità organizzative
  • Codici lingua
  • Centri di costo

I dati di riferimento possono provenire da fonti sia pubbliche che private e forniscono informazioni a diversi domini. A causa delle complesse connessioni tra i domini e le applicazioni che supportano i dati di riferimento, gestirli può presentare alcune sfide. La gestione dei dati di riferimento non deve essere eseguita manualmente. I dati di riferimento vengono generalmente utilizzati da ogni reparto dell'organizzazione per fornire contesto ai propri dati. Supporta qualità dei dati e fruibilità dei dati. 

I dati di riferimento forniscono una base per il processo di interpretazione dei dati utilizzato in varie applicazioni, sistemi e processi.

Lo scopo principale dei dati di riferimento è stabilire definizioni, classificazioni e relazioni comuni per gli elementi dei dati. Utilizza anche codici e valori predefiniti. In questo modo, i dati di riferimento migliorano la qualità dei dati e semplificano il processo di integrazione dei dati. Ciò, a sua volta, semplifica la condivisione dei dati.

Ad esempio, il settore finanziario utilizza identificatori di sicurezza, come Numeri di identificazione dei titoli internazionali (ISIN) o simboli ticker che comunicano dati di riferimento che identificano gli strumenti finanziari: obbligazioni, azioni e derivati. Durante l'e-commerce, l'uso di codici prodotto e categorizzazione può rendere molto più semplice la gestione standardizzata dell'inventario e dei prezzi. Nel settore sanitario, i sistemi di codifica medica aiutano a classificare e fatturare accuratamente i servizi medici.

Dati anagrafici e gestione dei dati anagrafici Spiegato

Si sono sviluppate due tipologie di gestione dei dati anagrafici: analitico e operativo. La gestione dei dati master operativi descrive i dati fondamentali che un'organizzazione utilizza per fare affari. Questi dati devono essere accurati e affidabili per evitare intoppi nelle transazioni e nella consegna e supportare il regolare flusso degli affari.

I sistemi di gestione dei dati analitici utilizzano i dati anagrafici per evitare problemi derivanti da informazioni contrastanti e ridondanti. Senza l'uso dei dati anagrafici, diversi dipartimenti svilupperebbero le proprie versioni dei dati anagrafici, risultando in più elenchi, con errori che si insinuano.

Per comprendere meglio i dati anagrafici, considera cosa non sono i dati anagrafici. 

  • Non sono dati transazionali: I dati transazionali vengono generati dalle varie applicazioni che supportano i processi quotidiani di vendita e acquisto dell'azienda. Sebbene queste informazioni vengano registrate e archiviate, i dati transazionali non vengono utilizzati su base regolare.
  • Non sono dati non strutturati: A forma libera o dati non strutturati non è né organizzato né formattato. I dati in formato libero sono costituiti da testo non strutturato, numeri, date e praticamente tutti i dati che non sono formattati/trasformati per funzionare con il sistema dell'organizzazione. I dati non strutturati possono includere il contenuto scritto di pagine Web o documenti, e-mail, sondaggi, articoli di riviste, ricerche di mercato, ecc.

Con il software appropriato, la gestione dei dati master può fornire un'ampia gamma di servizi, come la pulizia dei dati, la trasformazione dei dati e i processi di integrazione dei dati. Man mano che vengono aggiunte nuove origini dati, il file software per la gestione dei dati anagrafici può identificare, raccogliere, trasformare e integrare nuovi dati nel sistema di dati master. 

Di seguito sono elencati alcuni esempi di dati anagrafici normalmente utilizzati:

  • Dati dei clienti: Generalmente considerati la forma di dati anagrafici più comunemente utilizzata, i dati di base dei clienti includono indirizzi di fatturazione, indirizzi e-mail e numeri di telefono, ma sono cresciuti fino a includere preferenze di acquisto individuali basate sugli acquisti precedenti.
  • Informazioni prodotto: Questo tipo di dati elenca tutte le informazioni necessarie per supportare la progettazione, la produzione, le consegne e la manutenzione dei prodotti di un'azienda. I dati del prodotto includono specifiche tecniche, disegni, parti e assiemi. Può anche includere fatture per materiali, istruzioni di lavoro e fornitori approvati.
  • Dati dei dipendenti: Questi dati non dovrebbero essere disponibili a tutto il personale, ma solo a pochi selezionati. In genere include il numero di previdenza sociale del dipendente e il conto di deposito diretto, che dovrebbero essere mantenuti privati. Potrebbero essere elencate anche informazioni come indirizzo di casa, numero di telefono e parenti prossimi.
  • Acquisti: I dati relativi ai grandi acquisti e alle transazioni azionarie specifiche possono essere elencati come dati anagrafici.
  • Dati sull'ubicazione della filiale: Le ubicazioni di filiali, negozi, strutture e franchising sono informazioni permanenti/semipermanenti e vengono utilizzate su base regolare.

I dati anagrafici, combinati con la gestione dei dati anagrafici, possono essere utilizzati per supportare l'analisi dei dati. I dati master vengono spesso utilizzati con l'analisi, in parte perché sono affidabili, coerenti e affidabili. Ad esempio, un'azienda che utilizza più sistemi per archiviare i dati dei propri clienti corre il rischio che ciascun sistema funzioni con versioni diverse di tali dati e rovini un'analisi che combina i dati dei diversi sistemi.

Molte organizzazioni preferiscono farlo limitare l'accesso dei dati anagrafici a un numero ristretto di personale appropriato – per motivi di sicurezza – rendendo i dati di riferimento disponibili a tutti i membri dell’organizzazione.

Data Warehouse, dati anagrafici e dati di riferimento

Un data warehouse è una forma di gestione e archiviazione dei dati progettata per supportare l'analisi e lo sviluppo di business intelligence. Inoltre, può essere utilizzato per memorizzare sia dati anagrafici che dati di riferimento. I data warehouse sono scalabili e possono essere espansi facilmente. Man mano che un'azienda cresce, aumentano le sue esigenze di archiviazione dei dati, comprese le esigenze di una quantità crescente di dati master e di archiviazione di dati di riferimento. I data warehouse consentono questa crescita.

I data warehouse possono svolgere una serie di attività, compreso lo sviluppo della business intelligence, e sono particolarmente utili per analizzare quantità significative di dati per periodi di tempo prolungati.

Gestione anagrafica anagrafica può essere coordinato con un data warehouse dove centralizza e consolida i dati. I dati fluiscono nel data warehouse da una varietà di fonti, inclusi dati raccolti da siti esterni, dati transazionali interni, dati master operativi e dati di riferimento. Il processo consente alle organizzazioni di ottenere informazioni preziose dai propri dati.

I dati di riferimento possono essere archiviati in un data warehouse, in genere come suddivisione dei dati anagrafici. I data warehouse spesso organizzano i dati utilizzando uno schema a stella o a fiocco di neve, con una tabella centrale dei "fatti" che contiene i dati primari e tabelle aggiuntive delle "dimensioni", che contengono i dati di riferimento relativi ai dati primari. Ad esempio, in un data warehouse bancario, la tabella dei fatti potrebbe contenere dati bancari, come l'importo di un prestito, la data in cui è stato concesso il prestito e il cliente che ha ricevuto il prestito, mentre le tabelle delle dimensioni (dati di riferimento) potrebbero contenere informazioni su informazioni sul prodotto, dati demografici del cliente e dati sulla posizione.

spot_img

L'ultima intelligenza

spot_img