Zephyrnet-logo

Vijf typen machine learning die u moet kennen – IBM Blog

Datum:


Vijf typen machine learning die u moet kennen – IBM Blog




machine learning (ML)-technologieën kunnen de besluitvorming in vrijwel alle sectoren stimuleren, van de gezondheidszorg tot human resources tot financiën en in talloze gebruiksscenario’s, zoals computer visie, grote taalmodellen (LLM's), spraakherkenning, zelfrijdende auto's en meer.

De groeiende invloed van ML is echter niet zonder complicaties. De validatie- en trainingsdatasets die ten grondslag liggen aan ML-technologie worden vaak door mensen samengevoegd, en mensen zijn vatbaar voor vooroordelen en fouten. Zelfs in gevallen waarin een ML-model zelf niet bevooroordeeld of gebrekkig is, kan het inzetten ervan in de verkeerde context fouten veroorzaken met onbedoelde schadelijke gevolgen.

Dat is de reden waarom het diversifiëren van het AI- en ML-gebruik in ondernemingen van onschatbare waarde kan zijn voor het behouden van een concurrentievoordeel. Elk type en subtype ML-algoritme heeft unieke voordelen en mogelijkheden die teams kunnen inzetten voor verschillende taken. Hier bespreken we de vijf belangrijkste typen en hun toepassingen.

Wat is machine learning?

ML is een computerwetenschap, data science en kunstmatige intelligentie (AI)-subset waarmee systemen kunnen leren en verbeteren van gegevens zonder aanvullende programmeerinterventies.

In plaats van expliciete instructies te gebruiken voor prestatie-optimalisatie, vertrouwen ML-modellen op algoritmen en statistische modellen die taken implementeren op basis van datapatronen en gevolgtrekkingen. Met andere woorden: ML maakt gebruik van inputgegevens om de output te voorspellen, waarbij de output voortdurend wordt bijgewerkt zodra er nieuwe gegevens beschikbaar komen.

Op retailwebsites bijvoorbeeld algoritmen voor machine learning de aankoopbeslissingen van consumenten beïnvloeden door aanbevelingen te doen op basis van de aankoopgeschiedenis. De e-commerceplatforms van veel retailers – waaronder die van IBM, Amazon, Google, Meta en Netflix – vertrouwen op kunstmatige neurale netwerken (ANN’s) om gepersonaliseerde aanbevelingen te leveren. En detailhandelaren maken vaak gebruik van gegevens uit chatbots en virtuele assistenten, in samenwerking met ML en natuurlijke taalverwerking (NLP) technologie, om de winkelervaringen van gebruikers te automatiseren.

Typen machinaal leren

Machine learning-algoritmen vallen in vijf brede categorieën: begeleid leren, onbewaakt leren, semi-gesuperviseerd leren, zelfgecontroleerd en versterkend leren.

1. Begeleid machinaal leren

Machinaal leren onder toezicht is een type machine learning waarbij het model wordt getraind op een gelabelde dataset (dat wil zeggen dat de doel- of uitkomstvariabele bekend is). Als datawetenschappers bijvoorbeeld een model zouden bouwen voor het voorspellen van tornado's, zouden de invoervariabelen datum, locatie, temperatuur, windstroompatronen en meer kunnen omvatten, en de output zou de daadwerkelijke tornado-activiteit zijn die voor die dagen is geregistreerd.

Begeleid leren wordt vaak gebruikt voor risicobeoordeling, beeldherkenning, predictive analytics en fraudedetectie, en omvat verschillende soorten algoritmen.

  • Regressie-algoritmen— outputwaarden voorspellen door lineaire relaties tussen reële of continue waarden te identificeren (bijvoorbeeld temperatuur, salaris). Regressie-algoritmen omvatten lineaire regressie, willekeurige bos- en gradiëntversterking, evenals andere subtypen.
  • Classificatie-algoritmen—categorische uitvoervariabelen voorspellen (bijvoorbeeld ‘rommel’ of ‘geen rommel’) door stukjes invoergegevens te labelen. Classificatie-algoritmen omvatten onder meer logistieke regressie, k-dichtstbijzijnde buren en support vector machines (SVM's).
  • Naïeve Bayes-classificaties—classificatietaken mogelijk maken voor grote datasets. Ze maken ook deel uit van een familie van generatieve leeralgoritmen die de invoerverdeling van een bepaalde klasse of/of categorie modelleren. Naïeve Bayes-algoritmen omvatten Beslissingsbomen, die feitelijk zowel regressie- als classificatie-algoritmen kan huisvesten.
  • Neurale netwerken—de manier simuleren waarop het menselijk brein werkt, met een groot aantal gekoppelde verwerkingsknooppunten die processen kunnen faciliteren zoals vertaling van natuurlijke taal, beeldherkenning, spraakherkenning en beeldcreatie.
  • Willekeurige bosalgoritmen—een waarde of categorie voorspellen door de resultaten van een aantal beslissingsbomen te combineren.

2. Machine learning zonder toezicht

Niet-gecontroleerd leren algoritmen – zoals Apriori, Gaussian Mixture Models (GMM’s) en Principal Component Analysis (PCA) – trekken conclusies uit ongelabelde datasets, waardoor verkennende data-analyse wordt vergemakkelijkt en patroonherkenning en voorspellende modellering mogelijk worden gemaakt.

De meest gebruikelijke leermethode zonder toezicht is clusteranalyse, waarbij clusteralgoritmen worden gebruikt om datapunten te categoriseren op basis van waardeovereenkomst (zoals bij klantsegmentatie of onregelmatigheidsdetectie). Met associatie-algoritmen kunnen datawetenschappers associaties tussen dataobjecten in grote databases identificeren, waardoor datavisualisatie en dimensionaliteitsreductie worden vergemakkelijkt.

  • K-betekent clustering—wijst datapunten toe aan K-groepen, waarbij de datapunten die het dichtst bij een bepaald zwaartepunt liggen, onder dezelfde categorie zijn geclusterd en K clusters vertegenwoordigt op basis van hun grootte en granulariteitsniveau. K-means clustering wordt vaak gebruikt voor marktsegmentatie, documentclustering, beeldsegmentatie en beeldcompressie.
  • Hiërarchische clustering– beschrijft een reeks clustertechnieken, waaronder agglomeratieve clustering – waarbij datapunten aanvankelijk in groepen worden geïsoleerd en vervolgens iteratief worden samengevoegd op basis van gelijkenis totdat er één cluster overblijft – en verdeeldheidwekkende clustering – waarbij een enkel datacluster wordt verdeeld op basis van de verschillen tussen datapunten .
  • Probabilistische clustering– helpt bij het oplossen van dichtheidsschattings- of ‘zachte’ clusteringsproblemen door datapunten te groeperen op basis van de waarschijnlijkheid dat ze tot een bepaalde distributie behoren.

ML-modellen zonder toezicht vormen vaak de drijvende kracht achter de ‘klanten die dit kochten, kochten ook…’ soorten aanbevelingssystemen.

3. Zelfgestuurd machinaal leren

Zelf-supervised learning (SSL) stelt modellen in staat zichzelf te trainen op ongelabelde data, in plaats van dat ze enorme geannoteerde en/of gelabelde datasets nodig hebben. SSL-algoritmen, ook wel voorspellende of voorwendsel-leeralgoritmen genoemd, leren een deel van de invoer van een ander deel, genereren automatisch labels en transformeren problemen zonder toezicht in gecontroleerde problemen. Deze algoritmen zijn vooral nuttig voor taken als computer vision en NLP, waarbij de hoeveelheid gelabelde trainingsgegevens die nodig zijn om modellen te trainen uitzonderlijk groot kan zijn (soms onbetaalbaar).

4. Versterkend leren

Versterking leren, Ook wel versterkend leren van menselijke feedback (RLHF), is een soort dynamische programmering die algoritmen traint met behulp van een systeem van beloning en straf. Om versterkend leren in te zetten, onderneemt een agent acties in een specifieke omgeving om een ​​vooraf bepaald doel te bereiken. De agent wordt beloond of gestraft voor zijn acties op basis van een vastgestelde maatstaf (meestal punten), waardoor de agent wordt aangemoedigd om goede praktijken voort te zetten en slechte praktijken te negeren. Door herhaling leert de agent de beste strategieën.

Algoritmen voor het leren van versterking zijn gebruikelijk bij de ontwikkeling van videogames en worden vaak gebruikt om robots te leren hoe ze menselijke taken kunnen repliceren.

5. Semi-begeleid leren

Het vijfde type machine learning-techniek biedt een combinatie tussen begeleid en onbewaakt leren.

Semi-gecontroleerde leeralgoritmen worden getraind op een kleine gelabelde dataset en een grote ongelabelde dataset, waarbij de gelabelde gegevens het leerproces voor de grotere hoeveelheid ongelabelde gegevens begeleiden. Een semi-gesuperviseerd leermodel zou onbewaakt leren kunnen gebruiken om dataclusters te identificeren en vervolgens gesuperviseerd leren kunnen gebruiken om de clusters te labelen.

Generatieve vijandige netwerken (GAN’s) –diepgaand leren tool die ongelabelde gegevens genereert door twee neurale netwerken te trainen – is een voorbeeld van semi-gecontroleerd machinaal leren.

Ongeacht het type kunnen ML-modellen data-inzichten uit bedrijfsdata halen, maar hun kwetsbaarheid voor vooringenomenheid tussen mens en data maakt verantwoorde AI-praktijken een organisatorische noodzaak.

Beheer een reeks machine learning-modellen met watstonx.ai

Bijna iedereen, van ontwikkelaars tot gebruikers tot toezichthouders, houdt zich wel eens bezig met toepassingen van machinaal leren, of deze nu rechtstreeks in wisselwerking staan ​​met AI-technologie of niet. En de acceptatie van ML-technologie versnelt alleen maar. De mondiale machine learning-markt werd gewaardeerd op 19 miljard dollar in 2022 en zal naar verwachting in 188 2030 miljard dollar bereiken (een CAGR van ruim 37 procent).

De omvang van de adoptie van ML en de groeiende impact ervan op het bedrijfsleven maken het begrijpen van AI- en ML-technologieën tot een voortdurende (en van cruciaal belang) engagement, dat waakzaam toezicht en tijdige aanpassingen vereist naarmate de technologieën evolueren. Met IBM® watsonx.ai™ AI studio kunnen ontwikkelaars eenvoudig ML-algoritmen en -processen beheren.

IBM watsonx.ai – onderdeel van het IBM watsonx™ AI- en dataplatform – combineert nieuwe generatieve AI-mogelijkheden en een ondernemingsstudio van de volgende generatie om AI-bouwers te helpen AI-modellen te trainen, valideren, afstemmen en implementeren met een fractie van de data, in een fractie van de tijd. Watsonx.ai biedt teams geavanceerde functies voor het genereren en classificeren van gegevens waarmee bedrijven data-inzichten kunnen benutten voor optimale AI-prestaties in de echte wereld.

In het tijdperk van dataproliferatie zijn AI en machinaal leren net zo belangrijk voor de dagelijkse bedrijfsvoering als voor technologische innovatie en zakelijke concurrentie. Maar als nieuwe pijlers van een moderne samenleving bieden ze ook een kans om de IT-infrastructuren van ondernemingen te diversifiëren en technologieën te creëren die ten goede komen aan bedrijven en de mensen die daarvan afhankelijk zijn.

Verken de watsonx.ai AI-studio


Meer van Kunstmatige intelligentie




Klantenservicetrends die winnende organisaties moeten volgen

4 min gelezen - Aandacht besteden aan de nieuwste trends op het gebied van klantenservice zorgt ervoor dat een organisatie voorbereid is op veranderende klantverwachtingen. De loyaliteit van klanten neemt af, onder impuls van de COVID-19-pandemie, sociale invloeden en het gemak waarmee van merk kan worden gewisseld. Meer dan ooit moeten organisaties op de hoogte blijven van veranderingen in de klantenservice-ervaring om de klanttevredenheid te verbeteren en aan de toegenomen klantbehoeften te voldoen. Uit een onderzoek van Gartner uit 2023 bleek dat 58% van de leiders bedrijfsgroei als een van hun belangrijkste doelen identificeerde.




Vijf open-source AI-tools om te kennen

5 min gelezen - Open-source kunstmatige intelligentie (AI) verwijst naar AI-technologieën waarbij de broncode voor iedereen vrij beschikbaar is om te gebruiken, aan te passen en te verspreiden. Wanneer AI-algoritmen, vooraf getrainde modellen en datasets beschikbaar zijn voor openbaar gebruik en experimenten, ontstaan ​​creatieve AI-toepassingen doordat een gemeenschap van vrijwilligers enthousiast voortbouwt op bestaand werk en de ontwikkeling van praktische AI-oplossingen versnelt. Als gevolg hiervan leiden deze technologieën vaak tot de beste tools om complexe uitdagingen in veel zakelijke toepassingen aan te pakken.…




IBM Tech Now: 11 december 2023

<1 min gelezen - Welkom IBM Tech Now, onze videowebserie met het laatste en beste nieuws en aankondigingen in de wereld van technologie. Zorg ervoor dat u zich abonneert op ons YouTube-kanaal, zodat u op de hoogte wordt gehouden telkens wanneer er een nieuwe IBM Tech Now-video wordt gepubliceerd. IBM Tech Now: aflevering 90 In deze aflevering behandelen we de volgende onderwerpen: IBM Quantum Heron IBM Quantum System Two De GA van watsonx.governance Blijf aangesloten U kunt de IBM Blog-aankondigingen bekijken voor een volledige…




Het softwaregedefinieerde voertuig: de architectuur achter de volgende evolutie van de auto-industrie

4 min gelezen - Steeds meer consumenten verwachten nu dat hun voertuigen een ervaring bieden die niet verschilt van die van andere slimme apparaten. Ze streven naar volledige integratie in hun digitale leven en verlangen naar een voertuig dat hun activiteiten kan beheren, functionaliteit kan toevoegen en nieuwe functies mogelijk kan maken, voornamelijk of geheel via software. Volgens een GMI-rapport zal de wereldwijde softwaregedefinieerde voertuigmarkt (SDV) tussen 22.1 en 2023 naar verwachting een CAGR van 2032% bereiken. Deze groei wordt aangedreven door de toenemende vraag naar geavanceerde…

IBM-nieuwsbrieven

Ontvang onze nieuwsbrieven en onderwerpupdates die de nieuwste thought leadership en inzichten over opkomende trends bieden.

Abonneer nu

Meer nieuwsbrieven

spot_img

Laatste intelligentie

spot_img