Logo Zephyrnet

Database grafici: vantaggi e migliori pratiche – DATAVERSITY

Data:

database graficodatabase grafico
Shutterstock

I database grafici sono migliorati in modo significativo a partire dagli anni '1990, con nuovi sviluppi e una migliore realizzazione delle migliori pratiche. La tecnologia dei grafici è diventata uno dei metodi più popolari per eseguire ricerche sui big data. La sua attenzione alla ricerca di relazioni e la sua flessibilità lo rendono ideale per una varietà di progetti di ricerca. La consapevolezza dei nuovi sviluppi e la comprensione delle migliori pratiche semplificheranno qualsiasi lavoro con i database a grafo.

I database grafici lo sono tipicamente considerato una tecnologia NoSQL o non relazionale, fornendo loro la possibilità di estendere la memoria/storage e la ricerca in qualsiasi direzione, senza la necessità di trasferire il progetto su strutture diverse. Sebbene i sistemi SQL possano supportare i database a grafo, soprattutto con i recenti miglioramenti, le architetture NoSQL sono in genere molto più efficaci. Va notato che un database relazionale/SQL può funzionare insieme a un database a grafo NoSQL, completandosi a vicenda sfruttando i punti di forza di entrambi i sistemi.

I principi fondamentali

Un database a grafo è progettato per assegnare lo stesso valore sia ai dati che alle relazioni che collegano i dati. I dati e le relazioni sono considerati ugualmente importanti. Strutture dei grafici (il nodo e il bordo) vengono utilizzati per rappresentare e archiviare i dati. Un nodo nei database a grafo rappresenta il record/oggetto/entità, mentre il bordo rappresenta la relazione tra i nodi. Interrogare le relazioni è abbastanza veloce, poiché sono archiviate all'interno del database stesso.

I nodi possono essere descritti come le entità all'interno di un grafico. Questi nodi possono essere contrassegnati con etichette che rappresentano diversi ruoli nel dominio. Le etichette dei nodi possono essere utilizzate anche per allegare metadati (indice o informazioni di identificazione) a determinati nodi.

I bordi, o relazioni, forniscono connessioni tra due entità nodo. (Ad esempio, Volunteer-SCHEDULE-Weekdays o Car-DIRECTIONS-Destination.) Le relazioni hanno sempre una direzione, con un nodo iniziale, un nodo finale e un tipo. Anche le relazioni/bordi possono avere proprietà. In genere, le relazioni si basano su proprietà quantitative, come distanze, pesi, costi, valutazioni, punti di forza o intervalli di tempo. A causa del modo in cui le relazioni vengono salvate, due nodi possono associare qualsiasi tipo o numero qualsiasi di relazioni. Sebbene le relazioni vengano archiviate con un orientamento direzionale specifico, è possibile spostarsi in modo efficiente in entrambe le direzioni.

Utilizzo di database grafici

I grafici possono essere utilizzati in una varietà di applicazioni quotidiane, come la rappresentazione della mappatura delle fibre ottiche, la progettazione di un circuito stampato o qualcosa di semplice come strade e vie su una mappa. Facebook utilizza i grafici per formare una rete di dati, con nodi che rappresentano una persona o un argomento e bordi che rappresentano processi, attività o metodi che collegano i nodi.

Lockheed Martin Space utilizza tecnologie grafiche per gestione della catena di approvvigionamento, rendendo più facile per loro scoprire potenziali punti deboli e aumentare la resilienza della catena di approvvigionamento. Il loro CDAO, Tobin Thomas, ha dichiarato in un colloquio, “Pensate al ciclo di vita di come viene creato un prodotto. Utilizziamo tecnologie come i grafici per collegare insieme le relazioni, in modo da poter vedere il ciclo di vita basato su particolari parti o componenti e le relazioni tra ogni elemento."

Gartner prevede che mercato delle tecnologie grafiche raggiungerà i 3.2 miliardi di dollari entro il 2025. La crescente popolarità dei database a grafo è, in parte, il risultato di algoritmi ben progettati che rendono l’ordinamento dei dati molto, molto più semplice. L'infame Scandalo Panama Papers fornisce un eccellente esempio di come sono stati utilizzati gli algoritmi per cercare informazioni da migliaia di società di comodo. Questi conchiglie ha fornito a star del cinema, criminali e politici, come l’ex primo ministro islandese Sigmundur David Gunnlaugsson, un posto dove depositare denaro su conti offshore. Database grafici, con i loro Algoritmi, ha reso possibile la ricerca di queste società di comodo.

Problemi con i database grafici

I problemi che possono svilupparsi quando si lavora con i database a grafo includono l'utilizzo di dati imprecisi o incoerenti e l'apprendimento della scrittura di query efficienti. Risultati accurati si basano su informazioni accurate e coerenti. Se i dati in ingresso non sono affidabili, i risultati in uscita non possono essere considerati affidabili. 

Questo problema relativo alle query sui dati può rappresentare un problema anche se i dati archiviati utilizzano termini non generici mentre la query utilizza una terminologia generica. Inoltre, la query deve essere progettata per soddisfare i requisiti del sistema.

I dati imprecisi si basano su informazioni semplicemente errate. Sono stati inclusi errori palesi. I dati imprecisi possono includere un indirizzo sbagliato, un sesso sbagliato o qualsiasi altro errore. I dati incoerenti, invece, descrivono una situazione con più tabelle in un database che lavorano con gli stessi dati, ma li ricevono da input diversi con versioni leggermente diverse (errori di ortografia, abbreviazioni, ecc.). Le incoerenze sono spesso aggravate dalla ridondanza dei dati.

Interrogazioni grafiche interrogare il database a grafo e queste query devono essere accurate, precise e progettate per adattarsi al modello di database. Le query dovrebbero anche essere il più semplici possibile. Quanto più semplice è la query, tanto più mirati saranno i suoi risultati. Più complicata è la query, più ampi – e forse più confusi – saranno i risultati.

Migliori pratiche all'inizio

A fini di ricerca, la maggior parte dei dati collettivi gratuiti o acquistati sono ragionevolmente accurati. I dati imprecisi e incoerenti tendono a essere il risultato di un errore umano, ad esempio il completamento di vari moduli da parte di un venditore o di un utente della chat del sito Web. Il personale che forma il personale ricontrolla abitualmente le proprie informazioni (e fa ricontrollare il proprio lavoro durante il processo di formazione) può incoraggiare miglioramenti notevoli.

Le query dovrebbero iniziare in modo semplice e rimanere semplici. Se la ricerca diventa più complessa, non creare una query più complessa. Crea una nuova, semplice query da ricercare separatamente. CrowdStrike offre a esempio utile sul valore delle query semplicistiche mentre sviluppavano il loro strumento di analisi della sicurezza, Threat Strike. Gli autori di CrowdStrike Marcus King e Ralph Caraveo hanno scritto:

“All’inizio di questo progetto, il problema principale che dovevamo affrontare era la gestione di un volume estremamente elevato di dati con una velocità di scrittura altamente imprevedibile. All’epoca dovevamo analizzare alcuni milioni di eventi al giorno: un numero che sapevamo sarebbe cresciuto e che ora ammonta a centinaia di miliardi. Il progetto era scoraggiante, motivo per cui abbiamo deciso di fare un passo indietro e pensare non a come scalare, ma a come semplificare. Abbiamo stabilito che creando uno schema di dati straordinariamente semplice, saremmo stati in grado di creare una piattaforma solida e versatile da cui partire. Quindi il nostro team si è concentrato sull’iterazione e sul perfezionamento fino a quando non abbiamo ridotto l’architettura a qualcosa che fosse abbastanza semplice da poter essere scalabile quasi all’infinito”.

Intelligenza artificiale, apprendimento automatico e database grafici

I miglioramenti dei grafici applicati all'intelligenza artificiale stanno migliorando la precisione e la velocità di modellazione.

An Piattaforma AI combinato con un database a grafo ha dimostrato di migliorare con successo i modelli di apprendimento automatico, promuovendo il potenziale di processi decisionali complessi. La tecnologia dei grafici sembra integrarsi abbastanza bene con l’intelligenza artificiale e l’apprendimento automatico, rendendo le relazioni tra i dati più semplici, più espandibili e più efficienti.

Amazon ha rivolto la sua attenzione all'utilizzo machine learning per classificare nodi e bordi in base ai loro attributi. Il processo può essere utilizzato anche per prevedere le connessioni più probabili. Alcune versioni di questo tecnologia di apprendimento automatico/grafica L'opzione include mappe del mondo fisico, come la ricerca dei percorsi migliori per spostarsi da un luogo a un altro. Alcune versioni si concentrano su compiti più astratti – ad esempio la sintesi della conoscenza – e utilizzano modelli grafici basati su testo o reti concettuali.

Gli attuali database a grafo si sono evoluti al punto da essere in grado di risolvere alcune delle sfide più complicate del settore delle telecomunicazioni. La lotta alle frodi è una sfida che è diventata una priorità assoluta, con l’intelligenza artificiale e l’apprendimento automatico che stanno diventando la prima scelta per stare al passo con le minacce. I database grafici vengono utilizzati per supportare le tecniche analitiche utilizzate dall’intelligenza artificiale e dall’apprendimento automatico nella lotta alle frodi.

spot_img

L'ultima intelligenza

spot_img