Zephyrnet-logotyp

Knowledge Graphs 101: The Story (and Benefits) Bakom hypen – DATAVERSITY

Datum:

Kunskapsdiagram, även om de inte är lika välkända som andra datahanteringserbjudanden, är en beprövad dynamisk och skalbar lösning för att hantera företagsdatahanteringskrav över flera vertikaler. Som ett nav för data, metadata och innehåll ger de en enhetlig, konsekvent och entydig bild av data utspridda över olika system. Genom att använda global kunskap som sammanhang för tolkning och en källa för berikning, optimerar de också proprietär information så att organisationer kan förbättra beslutsfattandet och realisera tidigare otillgängliga korrelationer mellan sina datatillgångar. 

Organisationer vet redan att den data de behöver för att hantera är för mångsidig, spridd och med outgrundliga volymer för bara ett decennium sedan. Detta lämnar ofta affärsinsikter och möjligheter förlorade bland en tilltrasslad komplexitet av meningslös, silade data och innehåll. Kunskapsdiagram hjälper till att övervinna dessa utmaningar genom att förena dataåtkomst, tillhandahålla flexibel dataintegration och automatisera datahantering. Användningen av kunskapsgrafer har en enorm effekt på olika system och processer och det är därför Garner förutspår att 2025 kommer grafteknologier att användas i 80 % av data- och analysinnovationer, upp från 10 % 2021, vilket underlättar snabbt beslutsfattande i hela företaget. 

Definierade kunskapsdiagram och varför semantik (och ontologier) spelar roll

Enligt wikipedia, är en kunskapsgraf en kunskapsbas som använder en grafstrukturerad datamodell eller topologi för att representera och arbeta med data. Hjärtat i kunskapsdiagrammet är en kunskapsmodell – en samling sammanlänkade beskrivningar av begrepp, enheter, relationer och händelser där:

  • Beskrivningar har formell semantik som gör att både människor och datorer kan bearbeta dem effektivt och entydigt
  • Beskrivningar bidrar till varandra och bildar ett nätverk där varje enhet representerar en del av beskrivningen av de enheter som är relaterade till den
  • Diverse data kopplas samman och beskrivs av semantisk metadata enligt kunskapsmodellen

Genom att skapa en gemensam semantisk beskrivning möjliggör en kunskapsgraf en högre abstraktionsnivå som inte är beroende av den fysiska infrastrukturen eller dataformatet. Kallas ibland för a datatyg, det ger ett enhetligt, människovänligt och meningsfullt sätt att komma åt och integrera interna och externa data. Med hjälp av semantisk metadata ger kunskapsdiagram en konsekvent bild av olika företagsdata, och länkar samman kunskap som har spridits över olika system och intressenter. 

Med hjälp av naturlig språkbehandling (NLP) kan även textdokument integreras med kunskapsgrafer. Med tanke på att många forskare säger att mellan 75-85 % av en organisations kunskap är låst i statiska dokument, missas enormt värde och visdom. NLP-pipelines gynnas enormt, eftersom sofistikerade textanalysmetoder kan användas när man kombinerar maskininlärning med kunskapsgrafer. Kunskapsdiagram är också viktiga för alla semantiska AI och förklarliga AI-strategier.

ontologier är lika viktiga, eftersom de representerar ryggraden i den formella semantiken i en kunskapsgraf. Som diagrammets dataschema fungerar de som ett kontrakt mellan utvecklarna av kunskapsdiagrammet och dess användare angående betydelsen av datan. En användare kan vara en annan människa eller ett program som behöver tolka data på ett tillförlitligt och exakt sätt. Ontologier säkerställer en delad förståelse av data och dess betydelser. När formell semantik används för att uttrycka och tolka data i en kunskapsgraf, finns det flera representations- och modelleringsinstrument: 

  • Klasser: Oftast innehåller en enhetsbeskrivning en klassificering av enheten avseende en klasshierarki. Till exempel, när det handlar om allmänna nyheter eller affärsinformation, kan det finnas klasser som inkluderar Person, Organisation och Plats. Personer och organisationer kan ha en gemensam superklassagent. Platsen har vanligtvis många underklasser, t.ex. land, befolkad plats, stad, etc. 
  • relationer: Relationerna mellan enheter är vanligtvis taggade med typer, som ger information om relationens karaktär, t.ex. vän, släkting, konkurrent, etc. 
  • Kategorier: En enhet kan associeras med kategorier som beskriver någon aspekt av dess semantik, t.ex. "Big Four-konsulter" eller "XIX-talets kompositörer." En bok kan tillhöra alla dessa kategorier samtidigt: "Böcker om Afrika", "Bästsäljare", "Böcker av italienska författare", "Böcker för barn" etc. Ofta beskrivs och sorteras kategorier i en taxonomi. 
  • Fri text: Det är möjligt att lägga till "mänsklig-vänlig text" för att ytterligare förtydliga designintentioner för enheten och förbättra sökningen.

Kunskapsdiagram i Resource Description Framework (RDF)

Resource Description Framework är en standard för att beskriva webbresurser och datautbyte, utvecklad och standardiserad med World Wide Web Consortium (W3C). Bortsett från RDF ger den märkta egenskapsgrafmodellen (LPG) en lätt introduktion till hanteringen av grafdata. Gasol vinner ofta utvecklarnas hjärtan om data behöver samlas in ad hoc och grafanalyser utförs under loppet av ett enda projekt och grafen kasseras efteråt. Tyvärr saknar teknologistacken kring LPG:er standardiserade schema- eller modelleringsspråk och frågespråk, och det finns inga bestämmelser för formell semantik och interoperabilitetsspecifikationer (t.ex. inga serialiseringsformat, federationsprotokoll, etc.).

Medan RDF tillåter att uttalanden endast görs om noder, tillåter RDF-Star en att göra uttalanden om andra uttalanden och på så sätt bifoga metadata för att beskriva en kant i en graf såsom poäng, vikter, tidsaspekter och härkomst. Sammantaget ger kunskapsgrafer, representerade i RDF, det bästa ramverket för dataintegration, sammanslagning, länkning och återanvändning, eftersom de kombinerar följande:

  1. Expressivitet: Standarderna i Semantic Web-stacken – RDF(s) och OWL – tillåter en flytande representation av olika typer av data och innehåll: dataschema, taxonomier, vokabulär, alla typer av metadata, referenser och masterdata. RDF-star-tillägget gör det enkelt att modellera härkomst och annan strukturerad metadata. 
  2. Formell semantik: Alla standarder i Semantic Web-stacken kommer med väl specificerad semantik, som gör det möjligt för människor och datorer att tolka scheman, ontologier och data entydigt. 
  3. Prestanda: Alla specifikationer har genomtänkts och visat sig möjliggöra effektiv hantering av grafer med miljarder fakta och egenskaper.
  4. interoperabilitet: Det finns en rad specifikationer för dataserialisering, åtkomst (SPARQL-protokoll för slutpunkter), hantering (SPARQL Graph Store) och federation. Användningen av globalt unika identifierare underlättar dataintegration och publicering. 
  5. Standardisering: Allt ovanstående är standardiserat genom W3C-gemenskapsprocessen, för att säkerställa att kraven från olika aktörer uppfylls – från logiker till yrkesverksamma inom datahantering och systemdriftsteam. 

Det är dock viktigt att notera att inte varje RDF-graf är en kunskapsgraf. Till exempel är en uppsättning statistiska data, t.ex. BNP-data för länder, representerade i RDF inte en kunskapsgraf. En grafisk representation av data är ofta användbar, men det kan vara onödigt att fånga den semantiska kunskapen om data. Det kan också vara tillräckligt för en applikation att bara ha strängen "Italien" kopplad till strängen "BNP" och siffran "1.95 biljoner dollar" utan att behöva definiera vilka länder som är eller vad ett lands bruttonationalprodukt är. 

Det är sambanden och grafen som gör kunskapsgrafen, inte språket som används för att representera data. En nyckelfunktion i en kunskapsgraf är att enhetsbeskrivningar bör vara sammanlänkade med varandra. Definitionen av en enhet inkluderar en annan enhet. Denna länkning är hur grafen bildas (t.ex. A är B; B är C; C har D; A har D). Kunskapsbaser utan formell struktur och semantik, t.ex. Q&A "kunskapsbas" om en mjukvaruprodukt, representerar inte heller en kunskapsgraf. Det är möjligt att ha ett expertsystem som har en samling data organiserad i ett format som inte är en graf utan använder automatiserade deduktiva processer som en uppsättning "om-då"-regler för att underlätta analysen. 

Kunskapsgrafer är inte heller mjukvara. Snarare är en kunskapsgraf ett sätt att organisera och samla in data och metadata för att uppfylla kriterier och tjäna specifika syften som i sin tur används av olika programvaror. Data från en kunskapsgraf kan användas i flera oberoende system för olika ändamål.

Kunskapsdiagram och realtidsdatahantering

Kraven på vår data har drivit traditionella metoder för datahantering över sina gränser. Det finns stora mängder data, mer varje dag, och allt måste bearbetas, förstås och göras användbart. Det måste vara tillförlitligt och göras i realtid oavsett om det kommer från interna eller externa källor. När allt kommer omkring beror värdet av data helt på förmågan att utnyttja dess användning. Detta är en läxa som organisationer lär sig snabbt när de försöker minska utvecklings- och underhållskostnader och kommer att uppskatta fördelarna och intäkterna som kan uppnås genom att intelligent hantera organisationsdata. Dagens dataekosystem är också globala. 

Kunskapsdiagram kan hantera deras mångfald och bristen på centraliserad kontroll eftersom det är ett paradigm som passar det globala dataekosystemet som inkluderar varje organisation. Ännu bättre, eftersom informationen och en organisations förståelse och behov från den informationen förändras, förändras också kunskapsdiagrammet. Data som representeras av en kunskapsgraf har en strikt formell betydelse som både människor och maskiner kan tolka. Den innebörden gör den användbar för en människa men tillåter också automatiserade resonemang för att göra det möjligt för datorer att lätta en del av bördan. Med kunskapsdiagram kan organisationer ändra, beskära och anpassa schemat samtidigt som data behålls oförändrade och återanvändas för att skapa ännu fler insikter.

För flera år sedan gick vi bort från modeordet Big Data till Smart Data. Att ha oöverträffade mängder data drev på behovet av att ha en datamodell som speglade vår komplexa förståelse av information. För att göra data smarta kunde maskiner inte längre bindas av oflexibla och spröda datascheman. De behövde dataförråd som kunde representera den verkliga världen och de trassliga relationer som det innebär. Allt detta behövde göras på ett maskinläsbart sätt med formell semantik för att möjliggöra automatiserade resonemang som kompletterade och underlättade mänsklig expertis och beslutsfattande. 

Kunskapsgrafer uttryckta i RDF ger detta liksom många tillämpningar inom data- och informationstunga tjänster. Exempel inkluderar intelligent innehåll, förpackningar och återanvändning; lyhörd och kontextmedveten innehållsrekommendation; automatiserad kunskapsupptäckt; semantisk sökning; och intelligenta agenter. Det kan också stödja saker som företagsprofilering och rankning; informationsupptäckt i reglerande dokument; och övervakning av läkemedelsövervakningslitteratur. 

Enkelt uttryckt hjälper kunskapsgrafer företag att fatta kritiska beslut baserade på harmoniserade kunskapsmodeller och data som härrör från silade källsystem. De levererar också inbyggd skalbarhet och semantik som möjliggör ett effektivt, specifikt och lyhört förhållningssätt till data inklusive säkerhet och styrning, hantering av ägande och härkomst. 

plats_img

Senaste intelligens

plats_img