Zephyrnet-logo

Eigenschapsgrafieken versus kennisgrafieken

Datum:

Een van de grootste sterke punten van grafische databases is hun vermogen om "relaties" tussen de gegevens als even belangrijk te beschouwen als de gegevens zelf. Ze tonen een visueel beeld van een grafiek als reactie op vragen. Grafiek databases zijn ontworpen om gegevens vast te houden zonder deze te beperken tot een vast, vooraf bepaald model. Als gevolg hiervan zijn grafische databases erg goed in het beheren van complexe onderzoeksvragen.

Met behulp van een query en een startpunt, grafiek databases doorzoek de omringende gegevens - verzamel en verzamel informatie van duizenden knooppunten en relaties - terwijl u alle gegevens buiten de zoekperimeter laat.

Knooppunten worden gebruikt in grafiekdatabases en vertegenwoordigen entiteiten zoals accounts, bedrijven, mensen of elk ander item dat wordt gevolgd. (In een relationele database zijn ze het ruwe equivalent van een rij, record of relatie.)

Randen zijn lijnen die de knooppunten verbinden en vertegenwoordigen relaties. Een manager van een schaakclub die de relatie van Alice en Bob wil onderzoeken, zou bijvoorbeeld de grafiekendatabase doorzoeken en basisinformatie krijgen over Alice en Bob en hun relaties, evenals hun relatie met de schaakclub. (Een zoekopdracht met betrekking tot "alle" leden zou dezelfde basisinformatie weergeven, maar zou veel groter en complexer zijn.)

Randen (en de relaties die ze vertegenwoordigen) maken grafiekdatabases uniek. Betekenisvolle patronen kunnen worden gevonden bij het bekijken van de randen (relaties) die de knooppunten verbinden.

Bron afbeelding: Wikimedia Commons

De randen kunnen zowel gericht als ongericht zijn. Ongerichte grafieken gebruiken randen met 'geen specifieke richting' en suggereren een tweerichtings- of bidirectionele relatie. Elke rand kan worden gebruikt om in beide richtingen te bewegen. Gerichte grafieken daarentegen hebben randen die tijdens de query in één richting bewegen. Deze randen suggereren een eenrichtingsrelatie.

Een gerichte grafiek kan worden gebruikt om een ​​website weer te geven (het "start"- of "naar"-knooppunt), waarbij de eenrichtingsranden hyperlinks vertegenwoordigen en de gekoppelde bestemming als het "eind"- of "van"-knooppunt. Facebook kan worden gebruikt als een voorbeeld van ongerichte grafieken, omdat wanneer een eigenaar van een homepage een vriend toevoegt, die nieuwe vriend volledige toegang heeft tot de openbare inhoud van de eigenaar van de pagina. Communicatie gaat heen en weer in een tweerichtingsrelatie.

Alleen databases die van nature relaties omarmen, kunnen verbindingen tussen twee of meer databases efficiënt opslaan, verwerken en opvragen. Terwijl andere databases (zoals SQL) relaties tussen databases kunnen vinden bij het beantwoorden van een vraag, moeten ze dure AANMELDEN operaties.

Grafiek databases, aan de andere kant, zijn ontworpen om hun verbindingen (relaties) met de gegevens op te slaan. (Meest complexe zoekopdrachten met SQL-databasebeheersystemen vereisen JOIN-commando's.)

De oorsprong van grafische databases gaat terug tot de 18e-eeuwse Zwitserse wiskundige Leonhard Euler.

In de afgelopen jaren zijn twee soorten grafiekdatabases aanzienlijk populairder geworden. Zij zijn kennis grafieken en eigendomsgrafieken. Beide typen grafiekdatabases bieden flexibiliteit, een focus op relaties en inzichten die worden verkregen uit de bestaande gegevens. Eigenschapsgrafieken zijn beschreven als eenvoudiger, en een mogelijke eerste stap naar de invoering van een kennisgrafiek. 

Eigenschapsgrafieken (ook wel gelabelde eigenschappengrafieken genoemd)

A eigenschap grafiek gebruikt knooppunten, relaties, labels en 'eigenschappen'. Zowel de relaties als hun verbindingsknooppunten van gegevens hebben een naam en kunnen eigenschappen opslaan. Knooppunten kunnen worden gelabeld ter ondersteuning van het deel uitmaken van een groep. Eigenschapsgrafieken gebruiken "gerichte randen" en elke relatie heeft een startknooppunt en een eindknooppunt.

Aan relaties kunnen ook eigenschappen worden toegewezen. Deze functie is handig bij het presenteren van aanvullende metagegevens aan de relaties tussen de knooppunten.

Marko Rodriguez, medeoprichter en CEO van RReduX, vermeld:

“De term 'eigendomsgrafiek' is gaan duiden op een toegeschreven, multi-relationele grafiek. Dat wil zeggen, een grafiek waarbij de randen zijn gelabeld en zowel hoekpunten als randen kunnen een willekeurig aantal sleutel/waarde-eigenschappen hebben.'

Grafieken met gelabelde eigenschappen werden voor het eerst ontwikkeld in Zweden in een poging om een ​​enterprise content management (ECM)-systeem te ontwikkelen. De ontwikkelaars kozen voor een grafisch systeem dat de nadruk legde op efficiënte opslag, wat op zijn beurt hoge querysnelheden en snelle verplaatsingen tussen verbonden gegevens promoot. Vastgoedgrafiekendatabases waren gericht op snelle opstarttijden en prestaties, maar blijven zich ontwikkelen en nieuwe mogelijkheden ontwikkelen.

Eigenschapsgrafieken gebruiken relevante, gemakkelijk te herkennen labels die kunnen worden gebruikt voor het modelleren van gegevens en hun verbanden. Deze gegevens kunnen worden gestructureerd op manieren die voor mensen gemakkelijk te begrijpen zijn. Wanneer de gegevens worden gemodelleerd met deze relevante termen, kunnen deze op een gemakkelijk leesbare manier worden opgevraagd.

Enkele van de basisfuncties die eigendomsgrafieken zo populair maken, zijn:

  • Gebruikersvriendelijk: De visuele afbeeldingen van grafieken, met knopen en hun eigenschappen, lijken heel gemakkelijk te begrijpen
  • Geen vast schema: Deze functie werkt goed met gestructureerde en semi-gestructureerde gegevens
  • Relaties hebben begin- en eindpunten: Eigenschapsgrafieken hebben altijd een begin- en eindpunt (en een richting)
  • Aan relaties zijn eigenschappen toegewezen: Aan de randen kunnen waarden worden toegewezen die zaken als capaciteit, lengte of andere kenmerken kunnen specificeren
  • Interne ID's: De databases van eigenschapsgrafieken wijzen intern knooppunten en randen-ID's toe
    door tekstreeksen te gebruiken (relatietypen, knooppuntlabels en eigenschapsnamen)

Kennisgrafieken

Een kennisgrafiek is in feite een kaart van de gegevens van een organisatie. Het kan worden beperkt tot een specifiek domein, of worden gebruikt als een enterprise Knowledge Graph, waarbij alle gegevens die een bedrijf heeft opgeslagen in kaart worden gebracht.

Kennis grafieken worden soms 'semantische netwerken' genoemd. Dit komt omdat ze zijn gebaseerd op het semantische web, een systeem dat is ontworpen om de metadata van webpagina's en hun links te structureren, waardoor ze machineleesbaar worden. (Net als eigenschapsgrafieken gebruiken kennisgrafieken ook gerichte randen.)

Het semantische web, voor het eerst voorgesteld in 2001, sloeg nooit aan omdat het de reputatie kreeg te academisch te zijn. Google heeft echter in 2012 de basisconcepten voor zijn zoekmachine aangepast en noemde het de Google Kennis Grafiek. Om hun concurrentievermogen te behouden, hebben Microsoft, Yahoo, LinkedIn, enz. ook "kennisgrafieken" opgenomen.

Kennis grafieken gebruik semantische informatie om context te bieden en menselijke inzichten te ondersteunen. De kennisgrafiek vertegenwoordigt een verzameling onderling verbonden beschrijvingen van entiteiten (bedrijven, mensen, evenementen, concepten) en een raamwerk voor gegevensintegratie en -analyse. Vanwege hun vermogen om metadata machineleesbaar te maken, hebben kennisgrafieken een groot potentieel voor gebruik met machine learning en kunstmatige intelligentie.

Verschillende specifieke toepassingen zijn afhankelijk van kennisgrafieken. Deze omvatten data-zware services, zoals:

Kennisgrafieken zijn erg handig bij het werken met gegevensstof. De semantiekfunctie (en het gebruik van grafieken) ondersteunt ontdekkingslagen en gegevensorkestratie in een gegevensstructuur. Door de twee te combineren, is de datafabric gemakkelijker stapsgewijs en flexibeler uit te bouwen, wat het risico verlaagt en de implementatie versnelt.

Het proces stelt een organisatie in staat om het weefsel in fasen te ontwikkelen. Het kan worden gestart met een enkel domein, of een hoogwaardige use-case, en geleidelijk stapsgewijs worden uitgebreid met meer gegevens, gebruikers en use-cases.

A data fabric-architectuur, gecombineerd met een kennisgrafiek, ondersteunt nuttige mogelijkheden op veel belangrijke gebieden. De combinatie kan worden gebruikt om gerelateerde gegevens uit verschillende silo's met opmerkelijke flexibiliteit te verbinden, waardoor miljoenen gerelateerde gegevenspunten met elkaar worden verbonden.

Bedrijven kunnen ongekende flexibiliteit krijgen in het proces van data-integratie. Kennisgrafieken kunnen gecompliceerde gegevens ook aanzienlijk gemakkelijker te gebruiken en te begrijpen maken door een semantische laag van bedrijfsdefinities tot stand te brengen.

De recente doorbraken in natuurlijke taalverwerking (vragen stellen, entiteitsherkenning, relatieclassificatie, tekstclassificatie) hebben het voor bedrijven noodzakelijk gemaakt om NLP te gebruiken om concurrerend te blijven. (Natuurlijke taalverwerking verwijst naar de tak van kunstmatige intelligentie waarmee computers zowel tekst als gesproken woorden kunnen begrijpen.)

Kennisgrafieken worden, in combinatie met NLP, een krachtig hulpmiddel dat kan worden gebruikt voor datamining en onderzoek. Natuurlijke taalverwerkingspakketten (NLP) kunnen worden gebruikt creëren een kennisgrafiek-datamodel dat bruikbare data-inzichten biedt.

Er zijn semantische platforms waarin kunstmatige intelligentie en kennisgrafieken zijn verwerkt. De Zwemfeest Semantic Suite lijkt de koploper te zijn in het combineren van kunstmatige intelligentie met kennisgrafieken.

Het hebben van een door AI ondersteunde kennisgrafiek die gegevensactiva kan weergeven en koppelen, kan een concurrentievoordeel opleveren. Andreas Blumauer, de CEO en oprichter van de Semantisch webbedrijf zei:

“We kunnen eindelijk een heel grote hoeveelheid data gebruiken en er complexe queries over maken, verschillende databronnen tegelijkertijd valideren en samenvoegen.”

Afbeelding gebruikt onder licentie van Shutterstock.com 

Bron: https://www.dataversity.net/property-graphs-vs-knowledge-graphs/

spot_img

Laatste intelligentie

spot_img