Logo Zephyrnet

Grafici della conoscenza 101: La storia (e i vantaggi) dietro l'hype – DATAVERSITY

Data:

I grafici della conoscenza, sebbene non così conosciuti come altre offerte di gestione dei dati, sono una soluzione dinamica e scalabile comprovata per soddisfare i requisiti di gestione dei dati aziendali in diversi settori verticali. In quanto hub per dati, metadati e contenuti, forniscono una visione unificata, coerente e inequivocabile dei dati sparsi su diversi sistemi. Utilizzando la conoscenza globale come contesto interpretativo e fonte di arricchimento, ottimizzano anche le informazioni proprietarie in modo che le organizzazioni possano migliorare il processo decisionale e realizzare correlazioni precedentemente non disponibili tra le loro risorse di dati. 

Le organizzazioni sanno già che i dati che devono gestire sono troppo diversificati, dispersi e in volumi insondabili solo dieci anni fa. Ciò spesso lascia le informazioni e le opportunità aziendali perdute in una complessità intricata di dati e contenuti privi di significato e isolati. I grafici della conoscenza aiutano a superare queste sfide unificando l’accesso ai dati, fornendo un’integrazione flessibile dei dati e automatizzando la gestione dei dati. L'uso dei grafici della conoscenza ha un effetto enorme su vari sistemi e processi, ecco perché Garner prevede che entro il 2025, le tecnologie grafiche saranno utilizzate nell’80% delle innovazioni di dati e analisi, rispetto al 10% nel 2021, facilitando un rapido processo decisionale in tutta l’azienda. 

Definizioni dei grafici della conoscenza e perché la semantica (e le ontologie) sono importanti

Secondo wikipedia, un grafico della conoscenza è una base di conoscenza che utilizza un modello di dati o una topologia strutturata a grafico per rappresentare e operare sui dati. Il cuore del grafico della conoscenza è un modello di conoscenza, una raccolta di descrizioni interconnesse di concetti, entità, relazioni ed eventi in cui:

  • Le descrizioni hanno una semantica formale che consente sia alle persone che ai computer di elaborarle in modo efficiente e inequivocabile
  • Le descrizioni contribuiscono l'una all'altra, formando una rete, dove ogni entità rappresenta parte della descrizione delle entità ad essa correlate
  • Dati diversi sono collegati e descritti da metadati semantici secondo il modello di conoscenza

Creando una descrizione semantica comune, un grafo della conoscenza consente un livello più elevato di astrazione che non si basa sull'infrastruttura fisica o sul formato dei dati. A volte indicato come a tessuto dati, offre un modo unificato, user-friendly e significativo per accedere e integrare i dati interni ed esterni. Utilizzando metadati semantici, i grafici della conoscenza forniscono una visione coerente di diversi dati aziendali, collegando le conoscenze sparse tra diversi sistemi e stakeholder. 

Con l'aiuto dell'elaborazione del linguaggio naturale (NLP), i documenti di testo possono anche essere integrati con grafici della conoscenza. Dato che molti ricercatori affermano che tra il 75 e l'85% della conoscenza di un'organizzazione è racchiusa in documenti statici, si perdono valore e saggezza enormi. Le pipeline NLP ne traggono enormi vantaggi, poiché è possibile utilizzare sofisticati metodi di analisi del testo quando si combinano l’apprendimento automatico con i grafici della conoscenza. I grafici della conoscenza sono essenziali anche per qualsiasi strategia di intelligenza artificiale semantica e di intelligenza artificiale spiegabile.

Ontologie sono altrettanto importanti, poiché rappresentano la spina dorsale della semantica formale di un grafo della conoscenza. In quanto schema dei dati del grafico, servono da contratto tra gli sviluppatori del grafico della conoscenza e i suoi utenti riguardo al significato dei dati. Un utente potrebbe essere un altro essere umano o un'applicazione software che necessita di interpretare i dati in modo affidabile e preciso. Le ontologie garantiscono una comprensione condivisa dei dati e dei loro significati. Quando si utilizza la semantica formale per esprimere e interpretare i dati di un grafo della conoscenza, esistono diversi strumenti di rappresentazione e modellazione: 

  • Classi: Molto spesso, una descrizione di entità contiene una classificazione dell'entità relativa a una gerarchia di classi. Ad esempio, quando si tratta di notizie generali o informazioni aziendali, potrebbero essere presenti classi che includono Persona, Organizzazione e Posizione. Le persone e le organizzazioni possono avere un agente comune di superclasse. La località di solito ha numerose sottoclassi, ad esempio Paese, Luogo popolato, Città, ecc. 
  • Relazioni: Le relazioni tra entità sono solitamente contrassegnate da tipi che forniscono informazioni sulla natura della relazione, ad esempio amico, parente, concorrente, ecc. 
  • Categorie: Un'entità può essere associata a categorie che descrivono alcuni aspetti della sua semantica, ad esempio, "Consulenti Big Four" o "Compositori del XIX secolo". Un libro può appartenere contemporaneamente a tutte queste categorie: “Libri sull'Africa”, “Bestseller”, “Libri di autori italiani”, “Libri per ragazzi”, ecc. Spesso le categorie sono descritte e ordinate in una tassonomia. 
  • Testo libero: È possibile aggiungere un "testo comprensibile" per chiarire ulteriormente le intenzioni di progettazione dell'entità e migliorare la ricerca.

Grafici della conoscenza nel framework di descrizione delle risorse (CDR)

Resource Description Framework è uno standard per la descrizione delle risorse web e lo scambio di dati, sviluppato e standardizzato con il World Wide Web Consortium (W3C). Oltre a RDF, il modello LPG (etichettato delle proprietà del grafico) fornisce un'introduzione leggera alla gestione dei dati del grafico. I GPL spesso conquistano il cuore degli sviluppatori se i dati devono essere raccolti ad hoc e l'analisi dei grafici viene eseguita nel corso di un singolo progetto e il grafico viene successivamente scartato. Sfortunatamente, lo stack tecnologico attorno ai GPL manca di schemi standardizzati o di linguaggi di modellazione e linguaggi di query, e non ci sono disposizioni per la semantica formale e le specifiche di interoperabilità (ad esempio, nessun formato di serializzazione, protocolli federativi, ecc.).

Mentre RDF consente di fare affermazioni solo sui nodi, RDF-Star consente di fare affermazioni su altre affermazioni e in questo modo allegare metadati per descrivere un vantaggio in un grafico come punteggi, pesi, aspetti temporali e provenienza. Tutto sommato, i grafici della conoscenza, rappresentati in RDF, forniscono il miglior quadro per l’integrazione, l’unificazione, il collegamento e il riutilizzo dei dati, perché combinano quanto segue:

  1. Espressività: Gli standard nello stack del Web Semantico – RDF(s) e OWL – consentono una rappresentazione fluida di vari tipi di dati e contenuti: schemi di dati, tassonomie, vocabolari, tutti i tipi di metadati, riferimenti e dati master. L'estensione RDF-star semplifica la modellazione della provenienza e di altri metadati strutturati. 
  2. Semantica formale: Tutti gli standard nello stack del Web Semantico sono dotati di una semantica ben specificata, che consente agli esseri umani e ai computer di interpretare schemi, ontologie e dati in modo inequivocabile. 
  3. Performance: Tutte le specifiche sono state pensate e testate per consentire una gestione efficiente di grafici contenenti miliardi di fatti e proprietà.
  4. interoperabilità: Esiste una serie di specifiche per la serializzazione dei dati, l'accesso (protocollo SPARQL per endpoint), la gestione (SPARQL Graph Store) e la federazione. L'uso di identificatori univoci a livello globale facilita l'integrazione e la pubblicazione dei dati. 
  5. Standardizzazione: Tutto quanto sopra è standardizzato attraverso il processo della comunità W3C, per garantire che i requisiti dei diversi attori siano soddisfatti, dai logici ai professionisti della gestione dei dati aziendali e ai team operativi di sistema. 

Tuttavia, è importante notare che non tutti i grafi RDF sono grafi di conoscenza. Ad esempio, un insieme di dati statistici, ad esempio i dati PIL dei paesi, rappresentati in RDF non è un grafico della conoscenza. Una rappresentazione grafica dei dati è spesso utile, ma potrebbe non essere necessaria per acquisire la conoscenza semantica dei dati. Potrebbe anche essere sufficiente che in una domanda sia associata solo la stringa “Italia” alla stringa “PIL” e al numero “1.95 trilioni di dollari” senza la necessità di definire cosa sono i paesi o qual è il prodotto interno lordo di un paese. 

Sono le connessioni e il grafico a creare il grafo della conoscenza, non il linguaggio utilizzato per rappresentare i dati. Una caratteristica chiave di un knowledge graph è che le descrizioni delle entità dovrebbero essere interconnesse tra loro. La definizione di un'entità include un'altra entità. Questo collegamento è il modo in cui si forma il grafico (ad esempio, A è B; B è C; C ha D; A ha D). Anche le basi di conoscenza senza struttura formale e semantica, ad esempio, la “base di conoscenza” di domande e risposte su un prodotto software, non rappresentano un grafico della conoscenza. È possibile avere un sistema esperto che abbia una raccolta di dati organizzata in un formato che non sia un grafico ma utilizzi processi deduttivi automatizzati come un insieme di regole “se-allora” per facilitare l’analisi. 

Anche i grafici della conoscenza non sono software. Piuttosto un grafico della conoscenza è un modo per organizzare e raccogliere dati e metadati per soddisfare criteri e servire scopi specifici che, a loro volta, vengono utilizzati da diversi software. I dati di un grafico della conoscenza possono essere utilizzati in più sistemi indipendenti per scopi diversi.

Grafici della conoscenza e gestione dei dati in tempo reale

Le richieste relative ai nostri dati hanno spinto gli approcci tradizionali alla gestione dei dati oltre i loro limiti. Esistono quantità abbondanti di dati, ogni giorno di più, e tutti devono essere elaborati, compresi e resi utili. Deve essere affidabile ed eseguito in tempo reale, indipendentemente dal fatto che provenga da fonti interne o esterne. Dopotutto, il valore dei dati dipende interamente dalla capacità di sfruttarne l’utilizzo. Questa è una lezione che le organizzazioni stanno imparando rapidamente mentre cercano di ridurre i costi di sviluppo e manutenzione e arrivano ad apprezzare i vantaggi e i ricavi che si ottengono gestendo in modo intelligente i dati organizzativi. Anche gli ecosistemi di dati di oggi sono globali. 

I grafici della conoscenza possono far fronte alla loro diversità e alla mancanza di controllo centralizzato perché è un paradigma adatto all’ecosistema globale dei dati che include ogni organizzazione. Meglio ancora, man mano che le informazioni, la comprensione e le esigenze di un'organizzazione derivanti da tali informazioni cambiano, cambia anche il grafico della conoscenza. I dati rappresentati da un grafo della conoscenza hanno un significato formale rigoroso che sia gli esseri umani che le macchine possono interpretare. Questo significato lo rende utilizzabile da un essere umano ma consente anche il ragionamento automatizzato per consentire ai computer di alleggerire parte del carico. Con i grafici della conoscenza, le organizzazioni possono modificare, sfoltire e adattare lo schema mantenendo gli stessi dati e riutilizzandoli per ottenere ancora più informazioni.

Anni fa siamo passati dalla parola d’ordine Big Data a Smart Data. Disporre di quantità di dati senza precedenti ha reso necessaria la necessità di disporre di un modello di dati che rispecchiasse la nostra complessa comprensione delle informazioni. Per rendere i dati intelligenti, le macchine non potevano più essere vincolate da schemi di dati inflessibili e fragili. Avevano bisogno di archivi di dati che potessero rappresentare il mondo reale e le relazioni intricate che esso comporta. Tutto ciò doveva essere fatto in modo leggibile dalle macchine con una semantica formale per consentire un ragionamento automatizzato che integrasse e facilitasse la competenza umana e il processo decisionale. 

I grafici della conoscenza espressi in RDF forniscono questo oltre a numerose applicazioni in servizi ad alto contenuto di dati e informazioni. Gli esempi includono contenuto intelligente, imballaggio e riutilizzo; raccomandazione di contenuti reattivi e contestualmente consapevoli; scoperta automatizzata della conoscenza; ricerca semantica; e agenti intelligenti. Può anche supportare cose come la profilazione e il posizionamento dell'azienda; scoperta di informazioni nei documenti normativi; e monitoraggio della letteratura di farmacovigilanza. 

In parole povere, i grafici della conoscenza aiutano le aziende a prendere decisioni critiche sulla base di modelli di conoscenza armonizzati e dati derivati ​​da sistemi di origine isolati. Forniscono inoltre scalabilità e semantica native che consentono un approccio efficiente, specifico e reattivo ai dati, inclusa sicurezza e governance, gestione della proprietà e provenienza. 

spot_img

L'ultima intelligenza

spot_img