Zephyrnet-logo

Fem typer maskinlæring å vite – IBM Blog

Dato:


Fem typer maskinlæring å vite – IBM Blog




Maskinlæring (ML) teknologier kan drive beslutningstaking i praktisk talt alle bransjer, fra helsevesen til menneskelige ressurser til finans og i utallige brukssaker, som datasyn, store språkmodeller (LLM), talegjenkjenning, selvkjørende biler og mer.

Imidlertid er den økende innflytelsen av ML ikke uten komplikasjoner. Validerings- og opplæringsdatasettene som ligger til grunn for ML-teknologi er ofte aggregert av mennesker, og mennesker er utsatt for skjevhet og utsatt for feil. Selv i tilfeller der en ML-modell ikke i seg selv er partisk eller defekt, kan distribusjon av den i feil kontekst føre til feil med utilsiktede skadelige konsekvenser.

Derfor kan diversifisering av AI- og ML-bruk i bedrifter vise seg å være uvurderlig for å opprettholde et konkurransefortrinn. Hver type og undertype av ML-algoritme har unike fordeler og muligheter som team kan utnytte for forskjellige oppgaver. Her vil vi diskutere de fem hovedtypene og deres applikasjoner.

Hva er maskinlæring?

ML er en informatikk, datavitenskap og kunstig intelligens (AI) delsett som gjør det mulig for systemer å lære og forbedre seg fra data uten ytterligere programmeringsinngrep.

I stedet for å bruke eksplisitte instruksjoner for ytelsesoptimalisering, er ML-modeller avhengige av algoritmer og statistiske modeller som distribuerer oppgaver basert på datamønstre og slutninger. Med andre ord, ML utnytter inngangsdata for å forutsi utganger, og oppdaterer kontinuerlig utdata etter hvert som nye data blir tilgjengelige.

På forhandlernettsteder, for eksempel, maskinlæringsalgoritmer påvirke forbrukernes kjøpsbeslutninger ved å gi anbefalinger basert på kjøpshistorikk. Mange forhandleres e-handelsplattformer – inkludert IBM, Amazon, Google, Meta og Netflix – er avhengige av kunstige nevrale nettverk (ANN) for å levere personlige anbefalinger. Og forhandlere utnytter ofte data fra chatbots og virtuelle assistenter, i samråd med ML og naturlig språkbehandling (NLP) teknologi, for å automatisere brukernes handleopplevelser.

Maskinlæringstyper

Maskinlæringsalgoritmer faller inn i fem brede kategorier: overvåket læring, uovervåket læring, semi-overvåket læring, selvovervåket og forsterkende læring.

1. Overvåket maskinlæring

Overvåket maskinlæring er en type maskinlæring der modellen trenes på et merket datasett (dvs. målet eller utfallsvariabelen er kjent). For eksempel, hvis dataforskere bygde en modell for tornadovarsling, kan inndatavariablene inkludere dato, plassering, temperatur, vindstrømningsmønstre og mer, og utdataene ville være den faktiske tornadoaktiviteten registrert for disse dagene.

Overvåket læring brukes ofte til risikovurdering, bildegjenkjenning, prediktiv analyse og svindeldeteksjon, og omfatter flere typer algoritmer.

  • Regresjonsalgoritmer– forutsi utgangsverdier ved å identifisere lineære forhold mellom reelle eller kontinuerlige verdier (f.eks. temperatur, lønn). Regresjonsalgoritmer inkluderer lineær regresjon, tilfeldig skog og gradientforsterkning, så vel som andre undertyper.
  • Klassifiseringsalgoritmer– forutsi kategoriske utdatavariabler (f.eks. «søppel» eller «ikke søppel») ved å merke deler av inndata. Klassifiseringsalgoritmer inkluderer blant annet logistisk regresjon, k-nærmeste naboer og støttevektormaskiner (SVM).
  • Naive Bayes-klassifiserere—aktiver klassifiseringsoppgaver for store datasett. De er også en del av en familie av generative læringsalgoritmer som modellerer inputfordelingen til en gitt klasse eller/kategori. Naive Bayes-algoritmer inkluderer avgjørelse trær, som faktisk kan romme både regresjons- og klassifiseringsalgoritmer.
  • Nevrale nettverk— simulere måten den menneskelige hjernen fungerer på, med et stort antall koblede prosesseringsnoder som kan lette prosesser som naturlig språkoversettelse, bildegjenkjenning, talegjenkjenning og bildeskaping.
  • Tilfeldige skogalgoritmer— forutsi en verdi eller kategori ved å kombinere resultatene fra en rekke beslutningstrær.

2. Uovervåket maskinlæring

Uovervåket læring Algoritmer – som Apriori, Gaussiske blandingsmodeller (GMM) og hovedkomponentanalyse (PCA) – trekker slutninger fra umerkede datasett, og letter utforskende dataanalyse og muliggjør mønstergjenkjenning og prediktiv modellering.

Den vanligste metoden for uovervåket læring er klyngeanalyse, som bruker klyngealgoritmer for å kategorisere datapunkter i henhold til verdilikhet (som i kundesegmentering eller anomali påvisning). Assosiasjonsalgoritmer lar dataforskere identifisere assosiasjoner mellom dataobjekter i store databaser, noe som letter datavisualisering og dimensjonalitetsreduksjon.

  • K-betyr klynging— tildeler datapunkter i K-grupper, der datapunktene nærmest et gitt tyngdepunkt er gruppert under samme kategori og K representerer klynger basert på deres størrelse og granularitetsnivå. K-means clustering brukes ofte til markedssegmentering, dokumentclustering, bildesegmentering og bildekomprimering.
  • Hierarkisk klynging—beskriver et sett med klyngeteknikker, inkludert agglomerativ klynging – der datapunkter først blir isolert i grupper og deretter slått sammen iterativt basert på likhet til én klynge gjenstår—og splittende klynge – der en enkelt dataklynge er delt basert på forskjellene mellom datapunkter .
  • Probabilistisk klynging– hjelper til med å løse tetthetsestimering eller "myke" klyngeproblemer ved å gruppere datapunkter basert på sannsynligheten for at de tilhører en bestemt distribusjon.

ML-modeller uten tilsyn står ofte bak "kundene som kjøpte dette kjøpte også ..." typer anbefalingssystemer.

3. Selvstyrt maskinlæring

Self-supervised learning (SSL) gjør det mulig for modeller å trene seg på umerkede data, i stedet for å kreve massive kommenterte og/eller merkede datasett. SSL-algoritmer, også kalt prediktive eller påskuddslæringsalgoritmer, lærer en del av input fra en annen del, genererer automatisk etiketter og transformerer uovervåkede problemer til overvåkede. Disse algoritmene er spesielt nyttige for jobber som datasyn og NLP, der volumet av merkede treningsdata som trengs for å trene modeller kan være eksepsjonelt stort (noen ganger uoverkommelig).

4. Forsterkende læring

Forsterkningslæring, Også kalt forsterkende læring fra menneskelig tilbakemelding (RLHF), er en type dynamisk programmering som trener algoritmer ved hjelp av et system med belønning og straff. For å implementere forsterkende læring, tar en agent handlinger i et spesifikt miljø for å nå et forhåndsbestemt mål. Agenten blir belønnet eller straffet for sine handlinger basert på en etablert beregning (vanligvis poeng), og oppmuntrer agenten til å fortsette med god praksis og forkaste dårlige. Med repetisjon lærer agenten de beste strategiene.

Forsterkende læringsalgoritmer er vanlige i videospillutvikling og brukes ofte til å lære roboter hvordan de kan replikere menneskelige oppgaver.

5. Semi-veiledet læring

Den femte typen maskinlæringsteknikk tilbyr en kombinasjon mellom overvåket og uovervåket læring.

Semi-overvåket læringsalgoritmer trenes på et lite merket datasett og et stort umerket datasett, med de merkede dataene som styrer læringsprosessen for den større mengden umerkede data. En semi-overvåket læringsmodell kan bruke uovervåket læring for å identifisere dataklynger og deretter bruke overvåket læring for å merke klyngene.

Generative kontradiktoriske nettverk (GAN)—dyp læring verktøy som genererer umerkede data ved å trene to nevrale nettverk – er et eksempel på semi-overvåket maskinlæring.

Uavhengig av type kan ML-modeller hente datainnsikt fra bedriftsdata, men deres sårbarhet for menneskelig/dataskjevhet gjør ansvarlig AI-praksis til et organisatorisk imperativ.

Administrer en rekke maskinlæringsmodeller med watstonx.ai

Nesten alle, fra utviklere til brukere til regulatorer, engasjerer seg med applikasjoner av maskinlæring på et tidspunkt, enten de samhandler direkte med AI-teknologi eller ikke. Og bruken av ML-teknologi akselererer bare. De det globale maskinlæringsmarkedet ble verdsatt til USD 19 milliarder i 2022 og forventes å nå USD 188 milliarder innen 2030 (en CAGR på mer enn 37 prosent).

Omfanget av ML-adopsjon og dens økende virksomhetspåvirkning gjør forståelse av AI- og ML-teknologier til en pågående – og svært viktig – forpliktelse, som krever årvåken overvåking og rettidige justeringer etter hvert som teknologiene utvikler seg. Med IBM® watsonx.ai™ AI-studio, utviklere kan administrere ML-algoritmer og prosesser med letthet.

IBM watsonx.ai – en del av IBM watsonx™ AI- og dataplattformen – kombinerer nye generative AI-funksjoner og et neste generasjons bedriftsstudio for å hjelpe AI-byggere med å trene, validere, justere og distribuere AI-modeller med en brøkdel av dataene, i en brøkdel av tiden. Watsonx.ai tilbyr team avanserte datagenererings- og klassifiseringsfunksjoner som hjelper bedrifter å utnytte datainnsikt for optimal AI-ytelse i den virkelige verden.

I en tidsalder med dataspredning er AI og maskinlæring like integrert i den daglige forretningsdriften som de er i teknologisk innovasjon og forretningskonkurranse. Men som nye pilarer i et moderne samfunn representerer de også en mulighet til å diversifisere bedriftens IT-infrastrukturer og skape teknologier som fungerer til fordel for bedrifter og menneskene som er avhengige av dem.

Utforsk watsonx.ai AI-studio


Mer fra kunstig intelligens




Kundeservicetrender som vinner organisasjoner må følge

4 min lest - Å ta hensyn til de siste kundeservicetrendene sikrer at en organisasjon er forberedt på å møte endrede kundeforventninger. Kundelojalitet avtar, ansporet av COVID-19-pandemien, sosiale påvirkninger og det er enkelt å bytte merke. Mer enn noen gang må organisasjoner holde seg oppdatert på endringer i kundeserviceopplevelsen for å forbedre kundetilfredsheten og møte økte kundebehov. En Gartner-studie fra 2023 fant at 58 % av lederne identifiserte forretningsvekst som et av deres viktigste mål...




Fem åpen kildekode AI-verktøy å vite

5 min lest - Åpen kildekode kunstig intelligens (AI) refererer til AI-teknologier der kildekoden er fritt tilgjengelig for alle å bruke, modifisere og distribuere. Når AI-algoritmer, forhåndstrente modeller og datasett er tilgjengelige for offentlig bruk og eksperimentering, oppstår kreative AI-applikasjoner som et fellesskap av frivillige entusiaster som bygger på eksisterende arbeid og akselererer utviklingen av praktiske AI-løsninger. Som et resultat fører disse teknologiene ganske ofte til de beste verktøyene for å håndtere komplekse utfordringer på tvers av mange bedriftsbrukssaker.…




IBM Tech Now: 11. desember 2023

<1 min lest - ​Velkommen IBM Tech Now, vår videonettserie med de siste og beste nyhetene og kunngjøringene innen teknologiens verden. Sørg for at du abonnerer på YouTube-kanalen vår for å bli varslet hver gang en ny IBM Tech Now-video publiseres. IBM Tech Now: Episode 90 I denne episoden dekker vi følgende emner: IBM Quantum Heron IBM Quantum System Two GA for watsonx.governance Hold deg tilkoblet Du kan sjekke ut IBM-bloggkunngjøringene for en fullstendig...




Det programvaredefinerte kjøretøyet: Arkitekturen bak den neste utviklingen av bilindustrien

4 min lest - Flere og flere forbrukere forventer nå at kjøretøyene deres tilbyr en opplevelse som ikke er forskjellig fra den som tilbys av andre smarte enheter. De søker full integrering i deres digitale liv, og ønsker et kjøretøy som kan administrere operasjonene deres, legge til funksjonalitet og aktivere nye funksjoner primært eller helt gjennom programvare. I følge en GMI-rapport forventes det globale programvaredefinerte kjøretøy-markedet (SDV) å oppnå en CAGR på 22.1 % mellom 2023 og 2032. Denne veksten er drevet av økende etterspørsel etter avanserte...

IBMs nyhetsbrev

Få våre nyhetsbrev og emneoppdateringer som gir den siste tankeledelsen og innsikt om nye trender.

Abonner nå

Flere nyhetsbrev

spot_img

Siste etterretning

spot_img