Zephyrnet logo

Tietograafit 101: tarina (ja hyödyt) hypetyksen takana – DATAVERSITY

Treffi:

Tietokaaviot eivät ole yhtä tunnettuja kuin muut tiedonhallintatarjoukset, mutta ne ovat todistetusti dynaaminen ja skaalautuva ratkaisu yritysten tiedonhallintavaatimuksiin useilla eri toimialoilla. Tietojen, metatietojen ja sisällön keskuksena ne tarjoavat yhtenäisen, johdonmukaisen ja yksiselitteisen näkymän eri järjestelmiin hajallaan olevasta tiedosta. Käyttämällä globaalia tietämystä tulkinnan kontekstina ja rikastamisen lähteenä ne myös optimoivat omistusoikeudellisia tietoja, jotta organisaatiot voivat tehostaa päätöksentekoaan ja havaita aiemmin käyttämättömiä korrelaatioita datavarojensa välillä. 

Organisaatiot tietävät jo vuosikymmen sitten, että heidän tarvitsemansa tiedot ovat liian monipuolisia, hajallaan ja mittaamattomina. Tämä jättää usein liiketoiminnalliset oivallukset ja mahdollisuudet hukkaan merkityksettömien, silottujen tietojen ja sisällön sotkeutuneen monimutkaisuuden joukkoon. Tietokaaviot auttavat voittamaan nämä haasteet yhdistämällä tietojen saatavuuden, tarjoamalla joustavan tietojen integroinnin ja automatisoimalla tiedonhallintaa. Tietograafien käytöllä on valtava vaikutus erilaisiin järjestelmiin ja prosesseihin, minkä vuoksi Garner ennustaa että vuoteen 2025 mennessä graafiteknologioita käytetään 80 prosentissa data- ja analytiikkainnovaatioista, kun se vuonna 10 oli 2021 prosenttia, mikä helpottaa nopeaa päätöksentekoa koko yrityksessä. 

Määritellyt tietograafit ja miksi semantiikalla (ja ontologioilla) on merkitystä

Mukaan wikipedia, tietograafi on tietokanta, joka käyttää kuvaajarakenteista tietomallia tai topologiaa tietojen esittämiseen ja käyttämiseen. Tietograafin ydin on tietomalli – kokoelma käsitteiden, entiteettien, suhteiden ja tapahtumien toisiinsa liittyviä kuvauksia, joissa:

  • Kuvauksilla on muodollinen semantiikka, jonka avulla sekä ihmiset että tietokoneet voivat käsitellä niitä tehokkaasti ja yksiselitteisesti
  • Kuvaukset vaikuttavat toisiinsa muodostaen verkoston, jossa jokainen entiteetti edustaa osaa siihen liittyvien entiteettien kuvauksesta
  • Monipuolinen data yhdistetään ja kuvataan semanttisella metadatalla tietomallin mukaisesti

Luomalla yhteisen semanttisen kuvauksen tietograafi mahdollistaa korkeamman tason abstraktiota, joka ei riipu datan fyysiseen infrastruktuuriin tai muotoon. Joskus kutsutaan a datakangas, se tarjoaa yhtenäisen, ihmisystävällisen ja mielekkään tavan käyttää ja integroida sisäisiä ja ulkoisia tietoja. Semanttisten metatietojen avulla tietokaaviot tarjoavat yhtenäisen näkemyksen erilaisista yritystiedoista ja yhdistävät keskenään eri järjestelmiin ja sidosryhmiin hajallaan olevaa tietoa. 

Luonnollisen kielen käsittelyn (NLP) avulla tekstidokumentteja voidaan myös integroida tietograafiin. Koska monet tutkijat sanovat, että 75-85 % organisaation tiedosta on lukittuina staattisiin asiakirjoihin, valtava arvo ja viisaus jäävät kaipaamaan. NLP-putkistosta on valtavasti hyötyä, sillä pitkälle kehitettyjä tekstianalyysimenetelmiä voidaan käyttää yhdistettäessä koneoppimista tietokaavioihin. Tietokaaviot ovat myös välttämättömiä kaikille semanttiselle tekoälylle ja selitettävissä olevalle tekoälystrategialle.

ontologiat ovat yhtä tärkeitä, koska ne edustavat tietograafin muodollisen semantiikan selkäranka. Graafin tietoskeemana ne toimivat sopimusna tietograafin kehittäjien ja sen käyttäjien välillä datan merkityksestä. Käyttäjä voi olla toinen ihminen tai ohjelmistosovellus, jonka on tulkittava tiedot luotettavasti ja tarkasti. Ontologiat varmistavat yhteisen ymmärryksen datasta ja sen merkityksestä. Kun muodollista semantiikkaa käytetään tietograafin tietojen ilmaisemiseen ja tulkitsemiseen, on olemassa useita esitys- ja mallintamisvälineitä: 

  • Luokat: Entiteettikuvaus sisältää useimmiten luokkahierarkiaa koskevan kokonaisuuden luokituksen. Esimerkiksi yleisiä uutisia tai yritystietoja käsiteltäessä voi olla luokkia, jotka sisältävät Henkilö, Organisaatio ja Sijainti. Henkilöillä ja organisaatioilla voi olla yhteinen superluokan agentti. Sijainti sisältää yleensä useita alaluokkia, esim. maa, asuttu paikka, kaupunki jne. 
  • Ihmissuhteet: Entiteettien väliset suhteet on yleensä merkitty tyypeillä, jotka antavat tietoa suhteen luonteesta, esim. ystävä, sukulainen, kilpailija jne. 
  • Luokat: Kokonaisuus voidaan liittää luokkiin, jotka kuvaavat sen semantiikan osaa, esim. "Big Four -konsultit" tai "XIX-luvun säveltäjät". Kirja voi kuulua samanaikaisesti kaikkiin näihin luokkiin: "Kirjat Afrikasta", "Bestseller", "Italialaisten kirjailijoiden kirjat", "Kirjat lapsille" jne. Usein luokat kuvataan ja järjestetään taksonomiaan. 
  • Ilmainen teksti: On mahdollista lisätä "ihmisystävällistä tekstiä", joka selventää entiteetin suunnittelutarkoituksia ja parantaa hakua.

Tietograafit resurssin kuvauskehyksessä (RDF)

Resource Description Framework on standardi verkkoresurssien ja tiedonvaihdon kuvaamiseen, ja se on kehitetty ja standardoitu World Wide Web Consortiumin (W3C) kanssa. RDF:n lisäksi LPG-malli tarjoaa kevyen johdannon kuvaajatietojen hallintaan. Nestekaasut valloittavat usein kehittäjien sydämet, jos tietoja on kerättävä tapauskohtaisesti ja kaavioanalyysi suoritetaan yhden projektin aikana ja kaavio hylätään jälkeenpäin. Valitettavasti LPG:iden ympärillä olevasta teknologiasta puuttuu standardoituja skeemoja tai mallinnuskielejä ja kyselykieliä, eikä muodollisille semantiikka- ja yhteentoimivuusmäärityksille ole säännöksiä (esim. ei serialisointimuotoja, liittoutumisprotokollia jne.).

RDF sallii väitteiden tekemisen vain solmuista, kun taas RDF-Star mahdollistaa väitteiden tekemisen muista väitteistä ja siten liittämällä metatietoja kuvaamaan graafin reunaa, kuten pisteet, painotukset, ajalliset näkökohdat ja alkuperä. Kaiken kaikkiaan RDF:ssä esitetyt tietograafit tarjoavat parhaan kehyksen tietojen integroinnille, yhdistämiselle, linkittämiselle ja uudelleenkäytölle, koska niissä yhdistyvät seuraavat:

  1. Ilmaisukyky: Semanttisen Web-pinon standardit – RDF(s) ja OWL – mahdollistavat erityyppisten tietojen ja sisällön sujuvan esittämisen: tietoskeema, taksonomiat, sanastot, kaikenlaiset metatiedot, viittaukset ja perustiedot. RDF-tähtilaajennuksella on helppo mallintaa alkuperää ja muita strukturoituja metatietoja. 
  2. Muodollinen semantiikka: Kaikissa semanttisen Web-pinon standardeissa on hyvin määritelty semantiikka, jonka avulla ihmiset ja tietokoneet voivat tulkita skeemoja, ontologioita ja tietoja yksiselitteisesti. 
  3. Suorituskyky: Kaikki tekniset tiedot on harkittu ja todistetusti mahdollistaa miljardeja tosiasioita ja ominaisuuksia sisältävien kaavioiden tehokkaan hallinnan.
  4. yhteentoimivuus: Tietojen sarjoittamista, pääsyä (SPARQL-protokolla päätepisteille), hallintaa (SPARQL Graph Store) ja liittämistä varten on useita määrityksiä. Globaalisti yksilöllisten tunnisteiden käyttö helpottaa tietojen integrointia ja julkaisemista. 
  5. standardointi: Kaikki yllä oleva on standardoitu W3C-yhteisöprosessin kautta, jotta varmistetaan eri toimijoiden vaatimusten täyttyminen – logiikoista yrityksen tiedonhallinnan ammattilaisiin ja järjestelmäoperaatiotiimeihin. 

On kuitenkin tärkeää huomata, että jokainen RDF-graafi ei ole tietograafi. Esimerkiksi joukko tilastotietoja, esim. maiden BKT-tiedot, joka on esitetty RDF:ssä, ei ole tietograafi. Tiedon graafinen esitys on usein hyödyllinen, mutta saattaa olla tarpeetonta siepata datan semanttista tietoa. Saattaa myös riittää, että sovelluksessa vain merkkijono "Italia" liittyy merkkijonoon "BKT" ja numero "1.95 biljoonaa dollaria" ilman, että tarvitsee määritellä, mitkä maat ovat tai mikä on maan bruttokansantuote. 

Tietograafin muodostavat yhteydet ja kaavio, ei tietojen esittämiseen käytetty kieli. Tietograafin keskeinen ominaisuus on, että entiteettikuvaukset tulee linkittää toisiinsa. Yhden kokonaisuuden määritelmä sisältää toisen kokonaisuuden. Tämä linkittäminen on tapa, jolla graafi muodostuu (esim. A on B; B on C; C on D; A on D). Tietokannat ilman muodollista rakennetta ja semantiikkaa, esim. ohjelmistotuotteen Q&A ”tietokanta”, eivät myöskään edusta tietograafia. On mahdollista, että asiantuntijajärjestelmässä on kokoelma dataa, joka on järjestetty muotoon, joka ei ole kaavio, vaan käyttää automatisoituja deduktiivisia prosesseja, kuten joukko "jos-niin" -sääntöjä analyysin helpottamiseksi. 

Tietokaaviot eivät myöskään ole ohjelmistoja. Tietograafi on pikemminkin tapa järjestää ja kerätä dataa ja metadataa kriteerien täyttämiseksi ja palvelemaan tiettyjä tarkoituksia, joita puolestaan ​​käyttävät eri ohjelmistot. Yhden tietograafin dataa voidaan käyttää useissa itsenäisissä järjestelmissä eri tarkoituksiin.

Tietograafit ja reaaliaikainen tiedonhallinta

Tietojemme vaatimukset ovat työntäneet perinteiset tiedonhallintamenetelmät rajojen yli. Tietoa on valtavasti, enemmän joka päivä, ja se kaikki on käsiteltävä, ymmärrettävä ja hyödynnettävä. Sen on oltava luotettava ja tehtävä reaaliajassa riippumatta siitä, tuleeko se sisäisistä vai ulkoisista lähteistä. Loppujen lopuksi tietojen arvo riippuu täysin kyvystä hyödyntää sen käyttöä. Tämä on oppitunti, jonka organisaatiot oppivat nopeasti pyrkiessään vähentämään kehitys- ja ylläpitokustannuksia ja ymmärtämään organisaatiotietojen älykkäästä hallinnasta saatavia etuja ja tuottoa. Nykypäivän dataekosysteemit ovat myös globaaleja. 

Tietograafit voivat käsitellä niiden monimuotoisuutta ja keskitetyn hallinnan puutetta, koska se on paradigma, joka sopii globaaliin dataekosysteemiin, joka sisältää kaikki organisaatiot. Vielä parempi, kun tieto ja organisaation ymmärrys ja tarpeet siitä tiedosta muuttuvat, niin myös tietograafi muuttuu. Tietograafin edustamilla tiedoilla on tiukka muodollinen merkitys, jonka sekä ihmiset että koneet voivat tulkita. Tämä merkitys tekee siitä käyttökelpoisen ihmiselle, mutta mahdollistaa myös automaattisen päättelyn, jotta tietokoneet voivat keventää taakkaa. Tietokaavioiden avulla organisaatiot voivat muuttaa, karsia ja mukauttaa skeemaa pitäen samalla tiedot ennallaan ja käyttämällä niitä uudelleen saadakseen entistä enemmän oivalluksia.

Vuosia sitten siirryimme Big Datan muotisanasta Smart Dataan. Ennennäkemättömän suuret tietomäärät pakottivat tarpeeseen tietomallin, joka heijastaa monimutkaista ymmärrystämme tiedosta. Tiedon älykkääksi tekemiseksi koneita ei enää voitaisi sitoa joustamattomiin ja hauraisiin tietoskeemoihin. He tarvitsivat tietovarastoja, jotka voisivat edustaa todellista maailmaa ja sen sisältämiä sotkuisia suhteita. Kaikki tämä piti tehdä koneellisesti luettavalla tavalla muodollisen semantiikan avulla automatisoidun päättelyn mahdollistamiseksi, joka täydensi ja helpotti ihmisen asiantuntemusta ja päätöksentekoa. 

RDF-muodossa ilmaistut tietokaaviot tarjoavat tämän sekä lukuisia sovelluksia data- ja informaatiopalve- luissa. Esimerkkejä ovat älykäs sisältö, pakkaus ja uudelleenkäyttö; reagoiva ja asiayhteystietoinen sisältösuositus; automaattinen tiedonhaku; semanttinen haku; ja älykkäitä agentteja. Se voi myös tukea asioita, kuten yrityksen profilointia ja luokittelua; tiedon löytäminen sääntelyasiakirjoista; ja lääketurvatoiminnan kirjallisuuden seuranta. 

Yksinkertaisesti sanottuna tietokaaviot auttavat yrityksiä tekemään kriittisiä päätöksiä, jotka perustuvat yhdenmukaistettuihin tietomalleihin ja siled-lähdejärjestelmistä saatuun tietoon. Ne tarjoavat myös alkuperäisen skaalautuvuuden ja semantiikan, jotka mahdollistavat tehokkaan, tarkan ja reagoivan lähestymistavan tietoihin, mukaan lukien turvallisuus ja hallinto, omistajuuden ja alkuperän hallinta. 

spot_img

VC Cafe

VC Cafe

Uusin älykkyys

spot_img