Logo Zéphyrnet

Bases de données graphiques : avantages et bonnes pratiques – DATAVERSITY

Date :

bases de données graphiquesbases de données graphiques
Shutterstock

Les bases de données graphiques se sont considérablement améliorées depuis les années 1990, avec de nouveaux développements et une meilleure mise en œuvre des meilleures pratiques. La technologie graphique est devenue l’une des méthodes les plus populaires pour effectuer des recherches sur le Big Data. Son accent sur la recherche de relations et sa flexibilité le rendent idéal pour une variété de projets de recherche. Une prise de conscience des nouveaux développements et une compréhension des meilleures pratiques rationaliseront tout travail avec des bases de données graphiques.

Les bases de données graphiques sont généralement considéré une technologie NoSQL ou non relationnelle, leur offrant la possibilité d'étendre la mémoire/stockage et la recherche dans n'importe quelle direction, sans avoir besoin de transférer le projet vers des structures différentes. Bien que les systèmes SQL puissent prendre en charge les bases de données graphiques, notamment grâce aux améliorations récentes, les architectures NoSQL sont généralement beaucoup plus efficaces. Il convient de noter qu’une base de données relationnelle/SQL peut fonctionner aux côtés d’une base de données de graphes NoSQL, les deux se complétant en exploitant les atouts des deux systèmes.

Les principes de base

Une base de données graphique est conçue pour attribuer une valeur égale aux données et aux relations reliant les données. Les données et les relations sont considérées comme tout aussi importantes. Structures graphiques (le nœud et le bord) sont utilisés pour représenter et stocker les données. Un nœud dans les bases de données graphiques représente l'enregistrement/l'objet/l'entité, tandis que le bord représente la relation entre les nœuds. L'interrogation des relations est assez rapide, car elles sont stockées dans la base de données elle-même.

Les nœuds peuvent être décrits comme les entités au sein d’un graphe. Ces nœuds peuvent être étiquetés avec des étiquettes qui représentent différents rôles dans le domaine. Les étiquettes de nœud peuvent également être utilisées pour attacher des métadonnées (index ou informations d'identification) à certains nœuds.

Les arêtes, ou relations, fournissent des connexions entre deux entités nœuds. (Par exemple, Volunteer-SCHEDULE-Weekdays ou Car-DIRECTIONS-Destination.) Les relations ont toujours une direction, avec un nœud de début, un nœud de fin et un type. Les relations/arêtes peuvent également avoir des propriétés. Généralement, les relations sont basées sur des propriétés quantitatives, telles que les distances, les poids, les coûts, les notes, les points forts ou les intervalles de temps. En raison de la manière dont les relations sont enregistrées, deux nœuds peuvent associer n'importe quel type ou n'importe quel nombre de relations. Bien que les relations soient stockées avec une orientation directionnelle spécifique, ces relations peuvent être parcourues efficacement dans les deux sens.

Utiliser des bases de données graphiques

Les graphiques peuvent être utilisés dans diverses applications quotidiennes, telles que la représentation de la cartographie de fibres optiques, la conception d'un circuit imprimé ou quelque chose d'aussi simple que des routes et des rues sur une carte. Facebook utilise des graphiques pour former un réseau de données, avec des nœuds représentant une personne ou un sujet, et des bords représentant des processus, des activités ou des méthodes qui relient les nœuds.

Lockheed Martin Space utilise des technologies graphiques pour gestion de la chaîne logistique, ce qui leur permet de découvrir plus facilement les faiblesses potentielles et de renforcer la résilience de la chaîne d’approvisionnement. Leur CDAO, Tobin Thomas, a déclaré dans un interview, « Pensez au cycle de vie de la façon dont un produit est créé. Nous utilisons des technologies telles que des graphiques pour relier les relations entre elles, afin que nous puissions voir le cycle de vie en fonction de pièces ou de composants particuliers et les relations entre chaque élément.

Gartner prédit que le marché des technologies graphiques atteindra 3.2 milliards de dollars d'ici 2025. La popularité croissante des bases de données graphiques est, en partie, le résultat d'algorithmes bien conçus qui facilitent grandement le tri des données. L'infâme Scandale des Panama Papers fournit un excellent exemple de la manière dont les algorithmes ont été utilisés pour rechercher des informations auprès de milliers de sociétés écrans. Ces coquilles a fourni aux stars de cinéma, aux criminels et aux hommes politiques, comme l'ancien Premier ministre islandais Sigmundur David Gunnlaugsson, un endroit où déposer de l'argent sur des comptes offshore. Bases de données graphiques, avec leurs algorithmes, a rendu possible la recherche de ces sociétés écrans.

Problèmes avec les bases de données graphiques

Les problèmes qui peuvent survenir lors de l'utilisation de bases de données graphiques incluent l'utilisation de données inexactes ou incohérentes et l'apprentissage de l'écriture de requêtes efficaces. Des résultats précis reposent sur des informations précises et cohérentes. Si les données entrantes ne sont pas fiables, les résultats qui en ressortent ne peuvent pas être considérés comme dignes de confiance. 

Ce problème de requête de données peut également poser un problème si les données stockées utilisent des termes non génériques alors que la requête utilise une terminologie générique. De plus, la requête doit être conçue pour répondre aux exigences du système.

Les données inexactes sont basées sur des informations tout simplement fausses. Des erreurs flagrantes ont été incluses. Les données inexactes peuvent inclure une mauvaise adresse, un mauvais sexe ou un certain nombre d'autres erreurs. Les données incohérentes, en revanche, décrivent une situation dans laquelle plusieurs tables d'une base de données travaillent avec les mêmes données, mais les reçoivent de différentes entrées avec des versions légèrement différentes (fautes d'orthographe, abréviations, etc.). Les incohérences sont souvent aggravées par la redondance des données.

Requêtes graphiques interroger la base de données graphique, et ces requêtes doivent être exactes, précises et conçues pour s'adapter au modèle de base de données. Les requêtes doivent également être aussi simples que possible. Plus la requête est simple, plus ses résultats sont précis. Plus la requête est complexe, plus les résultats sont larges – et peut-être plus déroutants.

Meilleures pratiques au début

À des fins de recherche, la plupart des données groupées gratuites ou achetées sont raisonnablement exactes. Les données inexactes et incohérentes ont tendance à être le résultat d’une erreur humaine, par exemple lorsqu’un vendeur ou une personne clavardant sur un site Web remplit divers formulaires. Former le personnel à vérifier habituellement ses informations (et à faire revérifier son travail pendant le processus de formation) peut encourager des améliorations spectaculaires.

Les requêtes doivent commencer simplement et rester simples. Si la recherche devient plus complexe, ne créez pas de requête plus complexe. Créez une nouvelle requête simple à rechercher séparément. CrowdStrike propose un exemple utile sur la valeur des requêtes simplistes lors du développement de leur outil d'analyse de sécurité, Threat Strike. Les auteurs de CrowdStrike, Marcus King et Ralph Caraveo, ont écrit :

« Au début de ce projet, le principal problème que nous devions résoudre était la gestion d'un volume de données extrêmement important avec un taux d'écriture très imprévisible. À l’époque, nous devions analyser quelques millions d’événements par jour – un nombre dont nous savions qu’il allait croître et qui se chiffre aujourd’hui en centaines de milliards. Le projet était intimidant, c'est pourquoi nous avons décidé de prendre du recul et de réfléchir non pas à la manière de l'étendre, mais à la manière de le simplifier. Nous avons déterminé qu'en créant un schéma de données extraordinairement simple, nous serions en mesure de créer une plate-forme solide et polyvalente à partir de laquelle construire. Notre équipe s’est donc concentrée sur l’itération et le perfectionnement jusqu’à ce que nous réduisions l’architecture à quelque chose d’assez simple pour évoluer presque à l’infini.

Intelligence artificielle, apprentissage automatique et bases de données graphiques

Les améliorations graphiques appliquées à l’intelligence artificielle améliorent la précision et les vitesses de modélisation.

An Plateforme IA Il a été démontré que la fusion avec une base de données graphique améliore avec succès les modèles d’apprentissage automatique, favorisant ainsi le potentiel de processus décisionnels complexes. La technologie graphique semble s'intégrer assez bien à l'intelligence artificielle et à l'apprentissage automatique, rendant les relations entre les données plus simples, plus extensibles et plus efficaces.

Amazon a porté son attention sur l'utilisation machine learning pour classer les nœuds et les arêtes en fonction de leurs attributs. Le processus peut également être utilisé pour prédire les connexions les plus probables. Certaines versions de ceci apprentissage automatique/technologie graphique L'option inclut des cartes du monde physique, comme la recherche des meilleurs itinéraires pour se rendre d'un endroit à un autre. Certaines versions se concentrent sur des tâches plus abstraites – par exemple la synthèse des connaissances – et utilisent des modèles graphiques basés sur du texte ou des réseaux conceptuels.

Les bases de données graphiques actuelles ont évolué au point où elles sont capables de résoudre certains des défis les plus complexes du secteur des télécommunications. La lutte contre la fraude est un défi devenu hautement prioritaire, l’IA et l’apprentissage automatique devenant le premier choix pour anticiper les menaces. Des bases de données graphiques sont utilisées pour soutenir les techniques analytiques utilisées par l’IA et l’apprentissage automatique dans la lutte contre la fraude.

spot_img

Dernières informations

spot_img