Zephyrnet-logo

Semantische technologie en integratie 101: wat het is en waarom het ertoe doet

Datum:

Nieuwe technologieën zoals ChatGPT zijn razend populair, omdat ze tot doel hebben vragen te beantwoorden en informatie te verstrekken die ons leven gemakkelijker maakt. Toch is de validiteit van de gegenereerde resultaten onder de loep genomen en als gevolg daarvan is er veel nadruk gelegd op hoe organisaties relevante en betrouwbare gegevens in handen van gebruikers kunnen krijgen. Zelfs met de enorme hoeveelheid informatie die beschikbaar is, is het verkrijgen van inzichten een uitdaging als de gebruikte platforms het onderzoek niet kunnen begrijpen, de gevolgtrekkingen van de vraag niet kunnen begrijpen, kunnen identificeren waar de informatie zich bevindt en de gegevens kunnen leveren die nodig zijn om de vraag te beantwoorden.

Gegevensstoffen, welke Gartner definieert als een opkomend Data Management-ontwerp voor het bereiken van flexibele, herbruikbare en uitgebreide data-integratiepijplijnen, -services en -semantiek, helpen ervoor te zorgen dat data toegankelijk is voor zowel zakelijke als technologiegebruikers. Bedrijven passen datafabrics toe om zowel operationele als analytische use-cases te ondersteunen die worden geleverd via meerdere implementatie- en orkestratieplatforms en -processen, maar ze hebben een verscheidenheid aan technologieën en ontwerpconcepten nodig om effectief te zijn. Ze vereisen een combinatie van actieve metagegevens, kennisgrafieken, semantiek en machine learning om het ontwerp en de levering van gegevensintegratie te verbeteren. Hiervan zijn het overnemen en vaststellen van semantiek en het vaststellen van semantische standaarden die context en betekenis creëren (door middel van implementaties van kennisgrafieken) enkele van de belangrijkste en meest verwarrende delen van de puzzel en verdienen enige uitleg.

Semantische technologie gedefinieerd

Semantische technologie gebruikt formele semantiek om betekenis te geven aan de ongelijksoortige en ruwe gegevens die ons omringen. Semantische technologie bouwt, samen met Linked Data-technologie – zoals bedacht door de uitvinder van het World Wide Web, Sir Tim Berners-Lee – relaties op tussen gegevens in verschillende formaten en bronnen, van de ene string naar de andere, waardoor context wordt gecreëerd en koppelingen worden gemaakt uit deze relaties. In combinatie met formele semantiek – die de logische aspecten van betekenis bestudeert, zoals gevoel, verwijzing, implicatie en logische vorm – helpt de technologie AI-systemen taal te begrijpen en informatie te verwerken zoals mensen dat doen, waardoor ze kunnen opslaan, beheren en verwerken. informatie ophalen op basis van betekenis en logische relaties.

Semantische technologie definieert en koppelt gegevens op het web of binnen een onderneming door talen te ontwikkelen om rijke, zelfbeschrijvende onderlinge relaties van gegevens uit te drukken in een vorm die machines kunnen verwerken. Als gevolg hiervan kunnen deze machines lange tekenreeksen verwerken en tonnen gegevens indexeren en vervolgens informatie opslaan, beheren en ophalen op basis van betekenis en logische relaties. Wat nog belangrijker is, het helpt gerelateerde feiten te tonen in plaats van alleen maar woorden te matchen, wat bedrijven helpt relaties af te leiden om slimmere gegevens te ontdekken en kennis te extraheren uit enorme sets onbewerkte gegevens in verschillende formaten en uit verschillende bronnen.

Dit is vooral belangrijk omdat, volgens nog een Gartner-rapport, maken de groeiende niveaus van gegevensvolume en -distributie het voor organisaties moeilijk om hun gegevensactiva efficiënt en effectief te benutten. Data- en analyseleiders moeten een semantische benadering van hun bedrijfsgegevens overwegen; anders krijgen ze te maken met een eindeloze strijd met datasilo's. Het belangrijkste verschil tussen semantische technologie en andere datatechnologieën, zoals de relationele database, is dat het gaat om de betekenis en niet om de structuur van de data. Het World Wide Web Consortium (W3C). Semantic Web-initiatief stelt dat het doel van deze technologie in de context van het semantische web is om een ​​"universeel medium voor de uitwisseling van gegevens" te creëren door het wereldwijde delen van alle soorten persoonlijke, commerciële, wetenschappelijke en culturele gegevens soepel met elkaar te verbinden. 

Het W3C ontwikkelde open specificaties voor semantische technologie voor ontwikkelaars en heeft via open-sourceontwikkeling de infrastructuur geïdentificeerd die nodig is om op het web en elders te schalen en omvat:

  • Resourcebeschrijvingskader (RDF): Het formaat dat semantische technologie gebruikt om gegevens op te slaan op het Semantic Web of in een semantische grafische database. 
  • SPARQL (SPARQL-protocol en RDF-zoektaal): De semantische zoektaal die speciaal is ontworpen om gegevens in verschillende systemen en databases op te vragen en om gegevens die zijn opgeslagen in RDF-indeling op te halen en te verwerken.
  • Web Ontologie Taal (OWL): Optioneel gebruikt, is de op computationele logica gebaseerde taal ontworpen om het gegevensschema weer te geven en dat vertegenwoordigt rijke en complexe kennis over hiërarchieën van dingen en de relaties daartussen. Het is complementair aan RDF en maakt het mogelijk om een ​​dataschema/ontologie te formaliseren in een bepaald domein, los van de data. 

Simpel gezegd, door betekenis onafhankelijk van gegevens te formaliseren, stelt semantische technologie machines in staat om gegevens te "begrijpen", te delen en ermee te redeneren om meer waarde voor mensen te creëren. Semantische technologie helpt bedrijven om slimmere gegevens te ontdekken, relaties af te leiden en kennis te extraheren uit enorme sets onbewerkte gegevens in verschillende formaten en uit verschillende bronnen. Semantische grafiekdatabases - die zijn gebaseerd op de visie van het Semantic Web - maken het voor machines gemakkelijker om gegevens te integreren, verwerken en ophalen. 

Dit stelt organisaties op zijn beurt in staat snellere en kosteneffectievere toegang te krijgen tot zinvolle en nauwkeurige gegevens, die gegevens te analyseren en om te zetten in kennis waarmee ze zakelijke inzichten kunnen verwerven, voorspellende modellen kunnen toepassen en gegevensgestuurde beslissingen kunnen nemen. Al in 2007 zei Sir Berners-Lee tegen Bloomberg: “Semantische technologie is niet inherent complex. De taal van de semantische technologie is in wezen heel, heel eenvoudig. Het gaat alleen om de relaties tussen dingen. De kans is groot dat de 'relaties tussen dingen' organisaties helpen om data efficiënter te beheren.”

Semantische gegevensintegratie gedefinieerd

Semantische gegevensintegratie is het proces van het combineren van gegevens uit verschillende bronnen en het consolideren ervan tot zinvolle en waardevolle informatie door het gebruik van semantische technologie. Naarmate organisaties groter worden, groeien ook hun gegevens. Zonder de juiste datamanagementstrategie ontstaan ​​al snel intradepartementale en/of applicatiespecifieke datasilo's die de productiviteit en samenwerking in de weg staan. Semantische data-integratie biedt een oplossing die verder gaat dan standaard integratieoplossingen voor bedrijfsapplicaties door gebruik te maken van een datacentrische architectuur die is gebaseerd op een gestandaardiseerd model voor datapublicatie en -uitwisseling, namelijk de RDF. 

In dit raamwerk worden alle heterogene gegevens van een organisatie – gestructureerd, semi-gestructureerd en/of ongestructureerd – op dezelfde manier uitgedrukt, opgeslagen en geopend. Aangezien de gegevensstructuur tot uitdrukking komt via de koppelingen binnen de gegevens zelf, is deze niet beperkt tot een structuur die wordt opgelegd door de database en raakt deze niet achterhaald door de evolutie van de gegevens. Wanneer er veranderingen in de datastructuur optreden, worden deze weerspiegeld in de database door middel van veranderingen in de koppelingen binnen de data. Bovendien, en als de ruggengraat van semantische technologie, maakt RDF het mogelijk nieuwe feiten af ​​te leiden uit de bestaande gegevens, evenals de verrijking van de beschikbare kennis door toegang te krijgen tot Linked Open Data (LOD)-bronnen.

Semantische gegevens in actie: een 360-gradenweergave bereiken 

In een wereld waar volledige zichtbaarheid, nauwkeurige analyse en het oplossen van uitdagingen op het gebied van gegevenscomplexiteit het zakelijke landschap domineren, is het integreren van ongelijksoortige gegevens in een gesynchroniseerd 360-gradenperspectief van het grootste belang. Net als ChatGPT zoeken organisaties tegenwoordig naar oplossingen waarmee ze al hun gegevens kunnen beheren en bruikbaar kunnen maken voor besluitvorming en een verscheidenheid aan zakelijke gebruiksscenario's. 

Of hun database nu op zichzelf staat of is geïntegreerd in een groter bedrijfsecosysteem zoals een datafabric, bedrijven hebben een complete set data-integratietools nodig die complexe taken kunnen uitvoeren en gebruiksvriendelijk zijn. De mogelijkheid om eenvoudig heterogene gegevens uit meerdere bronnen te importeren en te transformeren, de gegevens te integreren en te koppelen als RDF-statements en twee of meer grafische databases samen te voegen, zijn allemaal essentiële functies die semantische oplossingen van wereldklasse ondersteunen.

spot_img

VC Café

VC Café

Laatste intelligentie

spot_img