Zephyrnet-logo

Een korte geschiedenis van semantiek

Datum:

semantieksemantiek

Als een woord werd 'semantiek' voor het eerst gebruikt door Michel Breal, een Franse filoloog (een taalhistoricus), in 1883. Hij bestudeerde hoe talen zijn georganiseerd, hoe talen in de loop van de tijd veranderen en de verbanden binnen talen. Over het algemeen is semantiek de studie van taal en haar betekenis. 

Meer specifiek kan semantiek worden gebruikt om te beschrijven hoe woorden verschillende betekenissen kunnen hebben voor verschillende mensen vanwege hun ervarings- en emotionele achtergrond. Een taal kan een natuurlijke taal zijn, zoals Frans, Nederlands of Hindi, of het kan een kunstmatige taal zijn, zoals een programmeertaal voor computers.

Theoretische computerwetenschappers bestuderen en ontwikkelen kunstmatige talen, terwijl taalkundigen natuurlijke talen bestuderen.

In 1967, Robert W. Floyd schreef een paper waarin hij het gebruik van taalsemantiek in computers beschrijft en kreeg de eer voor het starten van het gebied van programmeertaalsemantiek. Floyd beschreef programmeertalen als twee delen: semantiek (betekenis) en syntaxis (vorm). Om te worden gelezen, moet een computeralgoritme semantiek en syntaxis combineren en ze precies coderen zodat de computer ze automatisch kan verwerken. (Mensen doen dit op het onderbewuste niveau.)

Professor Donald Knuth zei het volgende over Floyd: “Vroeger rommelden programmeurs gewoon met programma's tot ze leken te werken. Zijn benadering om wiskunde te combineren met informatica was een openbaring voor het vakgebied.”

Eind jaren tachtig werd het concept van een wereldwijd informatiesysteem technologisch mogelijk. In 1980 won internet aan populariteit in Europa. In 1985 vond de eerste directe IP-verbinding tussen Noord-Amerika en Europa plaats. Dit werd al snel gevolgd door discussies over een webachtig communicatie- en informatiesysteem.

Het wereldwijde web en sociale media

Toen mensen begonnen te werken aan de Wereld wijde web, bepaalde het 'type' bedrijven dat geïnteresseerd was in de technologie de zakelijke richting die het zou inslaan. Terwijl mensen experimenteerden met het World Wide Web, verschoof de focus naar sociale interacties en sociale mediaplatforms zoals Facebook, LinkedIn, Google+, Instagram, Vine, Pinterest, Twitter en Tumblr, die allemaal menselijke interactie vereisen. 

Omdat natuurlijke taal een structuur heeft die mensen kunnen interpreteren maar machines niet, moesten mensen de betekenissen van een natuurlijke taal 'lezen' en een deel van het systeem worden.

Meer recentelijk zijn onderzoekers begonnen met het samenvoegen van programmeertalen met taalkunde, waardoor onderzoekers semantiek en big data kunnen combineren terwijl ze ernaar streven kunstmatige intelligentie naar het volgende niveau. Semantiek is veel meer een cognitief proces dan bestanden en computerherinneringen kunnen claimen. Het is het proces van het ontwerpen en gebruiken van een taal om kennis te communiceren en uit te drukken. Het kan ook een basis vormen voor het denkproces.

Het semantische web versus het World Wide Web

In mei 2001 verscheen een artikel met de titel “Het semantische web”werd gepubliceerd en geschreven door James Hendler, Ora Lassila en Tim Berners-Lee. (Tim Berners-Lee werd later directeur van het World Wide Web Consortium, of W3C.) Hun paper beschreef een nieuwe manier om internet te gebruiken en te doorzoeken, een extra dimensie vol nieuwe mogelijkheden. Hoewel een mens de tekst van een HTML-webpagina kan lezen, kan een computer/zoekmachine dat niet (tenzij tags die het kan lezen, opzettelijk zijn ingevoegd). Dit komt omdat HTML is ontworpen om visuele informatie op te slaan en niet in een programmeertaal is geschreven.

Het semantische web is een uitbreiding van het World Wide Web en is gericht op technologie. Het World Wide Web heeft een menselijke aanwezigheid nodig, terwijl het Semantic Web dat niet heeft. Het gebruikt de "verborgen", gecodeerde gegevens en, meer recentelijk, natuurlijke taalprocessen om informatie van internet te zoeken, samen te stellen en te ordenen. Het semantische web heeft alleen een menselijke aanwezigheid nodig om het verzoek te initiëren.

Semantiek en gekoppelde gegevens

Het concept van gekoppelde gegevens is een zeer nuttig aspect van het semantische web geweest en is opmerkelijk functioneel als educatief hulpmiddel. Het kan worden gebruikt om informatie over het hele internet te publiceren en te delen. De zin "Gekoppelde Open Data” wordt in ieder geval sinds 2007 gebruikt, toen de mailinglijst voor Linking Open Data voor het eerst werd gemaakt. De Koppeling Open Data gemeenschapHet doel van het bedrijf was om het web uit te breiden met een datacommons, waarbij informatie, meestal in de vorm van grafieken, als gratis informatie werd verstrekt.

Het internet biedt een bijna oneindige hoeveelheid informatie. Variërend van spreadsheets tot afbeeldingen en van video's tot de websites die alles samenbrengen, links verbinden de ene site met de andere en stellen ons in staat een constant groeiende stroom van informatie te ontdekken. Het World Wide Web wordt beschreven als een web van gekoppelde "documenten", terwijl gekoppelde gegevens een web van gekoppelde "gegevens" beschrijven. 

Met gekoppelde gegevens kunnen computers gegevens en informatie op veel complexe manieren combineren. Deze situatie werd mogelijk gemaakt door gestandaardiseerde vocabulaires en de grote zoekmachines die ze gebruiken. Bing, Google en Yahoo zijn begonnen met het gebruik van microdata-indelingen die in HTML-documenten zijn geplaatst om informatie te communiceren.

Het gebruik van natuurlijke talen door computers creëert toegang tot vele nieuwe vormen van data. Beschouw deze zinnen in gesproken vorm: "fruit vliegt als peren" en "de tijd vliegt als een vlinder." Hoewel de zinsstructuur van elk voorbeeld vrij gelijkaardig is, zijn hun betekenissen heel verschillend, waarbij de woorden "vliegen" en "zoals" verschillende definities hebben - definities die worden bepaald door de context. Het voorbeeld laat zien hoe zelfs een opmerkelijk eenvoudige zin een aanzienlijke hoeveelheid taalkundig begrip vereist.

Terwijl computers uitstekend zijn in het gebruik van de eenvoudige taal van de wiskunde, zijn menselijke talen opmerkelijk verwarrend in hun complexiteit en periodieke uitzonderingen op de regels. Een schaakprogramma kan tegen de meeste mensen spelen en de meeste mensen in een schaakspel verslaan. Hetzelfde kan niet gezegd worden van programma's die trivia spelen. Een normaal kind zou zo'n programma kunnen verslaan, omdat het programma een voldoende breed begrip van de betekenis, context en subtiliteiten van de taal mist. Dit probleem is van toepassing op een aanzienlijk aantal services en toepassingen. 

Zonder de context te begrijpen, kan een zoekmachine niet reageren met efficiënte resultaten voor woorden met meerdere betekenissen.

Semantiek en Virtuele assistenten

 Barry Zane, vice-president engineering voor Cambridge Semantics, zei:

"Op semantiek gebaseerde technologieën zijn de sleutel om gegevens gemakkelijk begrijpelijk te maken voor zowel mensen als computers, waardoor gegevensharmonisatie mogelijk wordt met behulp van gemeenschappelijke zakelijke betekenissen."

Met het World Wide Web als basis en de evolutie van semantiek naar natuurlijke talen, worden virtuele assistenten nu een realiteit. Siri van Apple is een goed voorbeeld van een virtuele assistent. Siri haalt niet alleen informatie op; het helpt mensen ook om hun online werk sneller en gemakkelijker af te ronden. Siri kan het gesproken woord tot op zekere hoogte interpreteren en kan ook verschillende diensten voor de gebruiker uitvoeren. Aanvankelijk waren de taken die Siri kon uitvoeren gericht op de mobiele internetgebruiker. Het boekt restaurantreserveringen, controleert de status van een vlucht of coördineert verschillende internetactiviteiten. Siri is nu overgestapt op andere platforms en apparaten, waaronder auto's.

In de laatste twee decennia, de droom van toevoegen natuurlijke taalprocessen tot computers, en ze net zo nonchalant laten praten als mensen, heeft zich aanzienlijk ontwikkeld.

Virtuele assistenten en diensten beginnen overal op het semantische web nuttige informatie uit te wisselen. Virtuele assistenten, zoals Google Now en Siri, hebben een breed scala aan start-ups geïnitieerd, vooral bedrijven die geautomatiseerde diensten leveren. We zijn getuige van de opkomst van nieuwe semantische diensten en technologieën. De samensmelting van trends in technologie en de zakenwereld creëert een nieuwe cyclus van innovatie die van invloed is op de manier waarop individuen en bedrijven hun werk uitvoeren, en zelfs hoe gegevens worden verzameld tot bruikbare informatie.

De flexibiliteit van virtuele assistenten werken op internet en beschikbaar zijn op verschillende apparaten, is een belangrijk onderdeel van het doel van het semantische web. 

Een aspect van het semantische web is de mogelijkheid om te communiceren met andere computers en te werken zonder menselijke aanwezigheid. Een mens moet het werk initiëren, maar dan kunnen ze iets anders met hun tijd doen. Het gebruik van semantiek levert een virtuele assistent op die zelfstandig kan werken en grote hoeveelheden data kan verwerken.

De ontwikkeling van chatbots

Chatbots, een relatief nieuwe tool om met (potentiële) klanten te communiceren, begonnen rond 2018-2020 aan populariteit te winnen. chatbots zijn ontworpen om de communicatie tussen computers en mensen te vereenvoudigen. Als gevolg van "transformers” (ontwikkeld in 2017) natuurlijke taalprocessystemen, gecombineerd met het open-source karakter van veel van deze modellen, is de communicatie tussen bots en mensen enigszins verbeterd.

Chatbots bieden organisaties een nieuwe manier om in realtime met de behoeften van potentiële klanten om te gaan. Hoewel chatbots nog in de kinderschoenen staan, kunnen ze 24 uur per dag reageren op online vragen. Verschillende organisaties, waaronder Google, Amazon, Facebook, Apple en Microsoft, hebben echter chatbots ontwikkeld sommige zijn nog steeds bezig met de knikken.

Afbeelding gebruikt onder licentie van Shutterstock.com

spot_img

Laatste intelligentie

spot_img