machine learning (ML)-technologieën kunnen de besluitvorming in vrijwel alle sectoren stimuleren, van de gezondheidszorg tot human resources tot financiën en in talloze gebruiksscenario’s, zoals computer visie, grote taalmodellen (LLM's), spraakherkenning, zelfrijdende auto's en meer.
De groeiende invloed van ML is echter niet zonder complicaties. De validatie- en trainingsdatasets die ten grondslag liggen aan ML-technologie worden vaak door mensen samengevoegd, en mensen zijn vatbaar voor vooroordelen en fouten. Zelfs in gevallen waarin een ML-model zelf niet bevooroordeeld of gebrekkig is, kan het inzetten ervan in de verkeerde context fouten veroorzaken met onbedoelde schadelijke gevolgen.
Dat is de reden waarom het diversifiëren van het AI- en ML-gebruik in ondernemingen van onschatbare waarde kan zijn voor het behouden van een concurrentievoordeel. Elk type en subtype ML-algoritme heeft unieke voordelen en mogelijkheden die teams kunnen inzetten voor verschillende taken. Hier bespreken we de vijf belangrijkste typen en hun toepassingen.
Wat is machine learning?
ML is een computerwetenschap, data science en kunstmatige intelligentie (AI)-subset waarmee systemen kunnen leren en verbeteren van gegevens zonder aanvullende programmeerinterventies.
In plaats van expliciete instructies te gebruiken voor prestatie-optimalisatie, vertrouwen ML-modellen op algoritmen en statistische modellen die taken implementeren op basis van datapatronen en gevolgtrekkingen. Met andere woorden: ML maakt gebruik van inputgegevens om de output te voorspellen, waarbij de output voortdurend wordt bijgewerkt zodra er nieuwe gegevens beschikbaar komen.
Op retailwebsites bijvoorbeeld algoritmen voor machine learning de aankoopbeslissingen van consumenten beïnvloeden door aanbevelingen te doen op basis van de aankoopgeschiedenis. De e-commerceplatforms van veel retailers – waaronder die van IBM, Amazon, Google, Meta en Netflix – vertrouwen op kunstmatige neurale netwerken (ANN’s) om gepersonaliseerde aanbevelingen te leveren. En detailhandelaren maken vaak gebruik van gegevens uit chatbots en virtuele assistenten, in samenwerking met ML en natuurlijke taalverwerking (NLP) technologie, om de winkelervaringen van gebruikers te automatiseren.
Typen machinaal leren
Machine learning-algoritmen vallen in vijf brede categorieën: begeleid leren, onbewaakt leren, semi-gesuperviseerd leren, zelfgecontroleerd en versterkend leren.
1. Begeleid machinaal leren
Machinaal leren onder toezicht is een type machine learning waarbij het model wordt getraind op een gelabelde dataset (dat wil zeggen dat de doel- of uitkomstvariabele bekend is). Als datawetenschappers bijvoorbeeld een model zouden bouwen voor het voorspellen van tornado's, zouden de invoervariabelen datum, locatie, temperatuur, windstroompatronen en meer kunnen omvatten, en de output zou de daadwerkelijke tornado-activiteit zijn die voor die dagen is geregistreerd.
Begeleid leren wordt vaak gebruikt voor risicobeoordeling, beeldherkenning, predictive analytics en fraudedetectie, en omvat verschillende soorten algoritmen.
- Regressie-algoritmen— outputwaarden voorspellen door lineaire relaties tussen reële of continue waarden te identificeren (bijvoorbeeld temperatuur, salaris). Regressie-algoritmen omvatten lineaire regressie, willekeurige bos- en gradiëntversterking, evenals andere subtypen.
- Classificatie-algoritmen—categorische uitvoervariabelen voorspellen (bijvoorbeeld ‘rommel’ of ‘geen rommel’) door stukjes invoergegevens te labelen. Classificatie-algoritmen omvatten onder meer logistieke regressie, k-dichtstbijzijnde buren en support vector machines (SVM's).
- Naïeve Bayes-classificaties—classificatietaken mogelijk maken voor grote datasets. Ze maken ook deel uit van een familie van generatieve leeralgoritmen die de invoerverdeling van een bepaalde klasse of/of categorie modelleren. Naïeve Bayes-algoritmen omvatten Beslissingsbomen, die feitelijk zowel regressie- als classificatie-algoritmen kan huisvesten.
- Neurale netwerken—de manier simuleren waarop het menselijk brein werkt, met een groot aantal gekoppelde verwerkingsknooppunten die processen kunnen faciliteren zoals vertaling van natuurlijke taal, beeldherkenning, spraakherkenning en beeldcreatie.
- Willekeurige bosalgoritmen—een waarde of categorie voorspellen door de resultaten van een aantal beslissingsbomen te combineren.
2. Machine learning zonder toezicht
Niet-gecontroleerd leren algoritmen – zoals Apriori, Gaussian Mixture Models (GMM’s) en Principal Component Analysis (PCA) – trekken conclusies uit ongelabelde datasets, waardoor verkennende data-analyse wordt vergemakkelijkt en patroonherkenning en voorspellende modellering mogelijk worden gemaakt.
De meest gebruikelijke leermethode zonder toezicht is clusteranalyse, waarbij clusteralgoritmen worden gebruikt om datapunten te categoriseren op basis van waardeovereenkomst (zoals bij klantsegmentatie of onregelmatigheidsdetectie). Met associatie-algoritmen kunnen datawetenschappers associaties tussen dataobjecten in grote databases identificeren, waardoor datavisualisatie en dimensionaliteitsreductie worden vergemakkelijkt.
- K-betekent clustering—wijst datapunten toe aan K-groepen, waarbij de datapunten die het dichtst bij een bepaald zwaartepunt liggen, onder dezelfde categorie zijn geclusterd en K clusters vertegenwoordigt op basis van hun grootte en granulariteitsniveau. K-means clustering wordt vaak gebruikt voor marktsegmentatie, documentclustering, beeldsegmentatie en beeldcompressie.
- Hiërarchische clustering– beschrijft een reeks clustertechnieken, waaronder agglomeratieve clustering – waarbij datapunten aanvankelijk in groepen worden geïsoleerd en vervolgens iteratief worden samengevoegd op basis van gelijkenis totdat er één cluster overblijft – en verdeeldheidwekkende clustering – waarbij een enkel datacluster wordt verdeeld op basis van de verschillen tussen datapunten .
- Probabilistische clustering– helpt bij het oplossen van dichtheidsschattings- of ‘zachte’ clusteringsproblemen door datapunten te groeperen op basis van de waarschijnlijkheid dat ze tot een bepaalde distributie behoren.
ML-modellen zonder toezicht vormen vaak de drijvende kracht achter de ‘klanten die dit kochten, kochten ook…’ soorten aanbevelingssystemen.
3. Zelfgestuurd machinaal leren
Zelf-supervised learning (SSL) stelt modellen in staat zichzelf te trainen op ongelabelde data, in plaats van dat ze enorme geannoteerde en/of gelabelde datasets nodig hebben. SSL-algoritmen, ook wel voorspellende of voorwendsel-leeralgoritmen genoemd, leren een deel van de invoer van een ander deel, genereren automatisch labels en transformeren problemen zonder toezicht in gecontroleerde problemen. Deze algoritmen zijn vooral nuttig voor taken als computer vision en NLP, waarbij de hoeveelheid gelabelde trainingsgegevens die nodig zijn om modellen te trainen uitzonderlijk groot kan zijn (soms onbetaalbaar).
4. Versterkend leren
Versterking leren, Ook wel versterkend leren van menselijke feedback (RLHF), is een soort dynamische programmering die algoritmen traint met behulp van een systeem van beloning en straf. Om versterkend leren in te zetten, onderneemt een agent acties in een specifieke omgeving om een vooraf bepaald doel te bereiken. De agent wordt beloond of gestraft voor zijn acties op basis van een vastgestelde maatstaf (meestal punten), waardoor de agent wordt aangemoedigd om goede praktijken voort te zetten en slechte praktijken te negeren. Door herhaling leert de agent de beste strategieën.
Algoritmen voor het leren van versterking zijn gebruikelijk bij de ontwikkeling van videogames en worden vaak gebruikt om robots te leren hoe ze menselijke taken kunnen repliceren.
5. Semi-begeleid leren
Het vijfde type machine learning-techniek biedt een combinatie tussen begeleid en onbewaakt leren.
Semi-gecontroleerde leeralgoritmen worden getraind op een kleine gelabelde dataset en een grote ongelabelde dataset, waarbij de gelabelde gegevens het leerproces voor de grotere hoeveelheid ongelabelde gegevens begeleiden. Een semi-gesuperviseerd leermodel zou onbewaakt leren kunnen gebruiken om dataclusters te identificeren en vervolgens gesuperviseerd leren kunnen gebruiken om de clusters te labelen.
Generatieve vijandige netwerken (GAN’s) –diepgaand leren tool die ongelabelde gegevens genereert door twee neurale netwerken te trainen – is een voorbeeld van semi-gecontroleerd machinaal leren.
Ongeacht het type kunnen ML-modellen data-inzichten uit bedrijfsdata halen, maar hun kwetsbaarheid voor vooringenomenheid tussen mens en data maakt verantwoorde AI-praktijken een organisatorische noodzaak.
Beheer een reeks machine learning-modellen met watstonx.ai
Bijna iedereen, van ontwikkelaars tot gebruikers tot toezichthouders, houdt zich wel eens bezig met toepassingen van machinaal leren, of deze nu rechtstreeks in wisselwerking staan met AI-technologie of niet. En de acceptatie van ML-technologie versnelt alleen maar. De mondiale machine learning-markt werd gewaardeerd op 19 miljard dollar in 2022 en zal naar verwachting in 188 2030 miljard dollar bereiken (een CAGR van ruim 37 procent).
De omvang van de adoptie van ML en de groeiende impact ervan op het bedrijfsleven maken het begrijpen van AI- en ML-technologieën tot een voortdurende (en van cruciaal belang) engagement, dat waakzaam toezicht en tijdige aanpassingen vereist naarmate de technologieën evolueren. Met IBM® watsonx.ai™ AI studio kunnen ontwikkelaars eenvoudig ML-algoritmen en -processen beheren.
IBM watsonx.ai – onderdeel van het IBM watsonx™ AI- en dataplatform – combineert nieuwe generatieve AI-mogelijkheden en een ondernemingsstudio van de volgende generatie om AI-bouwers te helpen AI-modellen te trainen, valideren, afstemmen en implementeren met een fractie van de data, in een fractie van de tijd. Watsonx.ai biedt teams geavanceerde functies voor het genereren en classificeren van gegevens waarmee bedrijven data-inzichten kunnen benutten voor optimale AI-prestaties in de echte wereld.
In het tijdperk van dataproliferatie zijn AI en machinaal leren net zo belangrijk voor de dagelijkse bedrijfsvoering als voor technologische innovatie en zakelijke concurrentie. Maar als nieuwe pijlers van een moderne samenleving bieden ze ook een kans om de IT-infrastructuren van ondernemingen te diversifiëren en technologieën te creëren die ten goede komen aan bedrijven en de mensen die daarvan afhankelijk zijn.
Verken de watsonx.ai AI-studio
Meer van Kunstmatige intelligentie
IBM-nieuwsbrieven
Ontvang onze nieuwsbrieven en onderwerpupdates die de nieuwste thought leadership en inzichten over opkomende trends bieden.
Abonneer nu
Meer nieuwsbrieven
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
- PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
- PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
- Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
- Bron: https://www.ibm.com/blog/machine-learning-types/