제퍼넷 로고

알아야 할 XNUMX가지 머신러닝 유형 – IBM 블로그

시간


알아야 할 XNUMX가지 머신러닝 유형 – IBM 블로그




기계 학습 (ML) 기술은 의료, 인사, 금융 등 거의 모든 산업 분야와 다음과 같은 다양한 사용 사례에서 의사 결정을 내릴 수 있습니다. 컴퓨터 비전, 큰 언어 모델 (LLM), 음성 인식, 자율 주행 자동차 등이 있습니다.

그러나 ML의 영향력이 커지면서 합병증이 발생하는 것은 아닙니다. ML 기술을 뒷받침하는 검증 및 교육 데이터 세트는 인간에 의해 집계되는 경우가 많으며 인간은 편견에 취약하고 오류가 발생하기 쉽습니다. ML 모델 자체가 편향되거나 결함이 있지 않은 경우에도 잘못된 컨텍스트에 배포하면 의도하지 않은 유해한 결과로 인해 오류가 발생할 수 있습니다.

그렇기 때문에 엔터프라이즈 AI 및 ML 사용을 다양화하는 것이 경쟁 우위를 유지하는 데 매우 중요할 수 있습니다. ML 알고리즘의 각 유형 및 하위 유형에는 팀이 다양한 작업에 활용할 수 있는 고유한 이점과 기능이 있습니다. 여기서는 다섯 가지 주요 유형과 해당 응용 프로그램에 대해 설명합니다.

머신 러닝이란 무엇입니까?

ML은 컴퓨터 과학입니다. 데이터 과학인공 지능 (AI) 시스템이 추가 프로그래밍 개입 없이 데이터를 학습하고 개선할 수 있도록 하는 하위 집합입니다.

ML 모델은 성능 최적화를 위해 명시적인 지침을 사용하는 대신 데이터 패턴과 추론을 기반으로 작업을 배포하는 알고리즘과 통계 모델을 사용합니다. 즉, ML은 입력 데이터를 활용하여 출력을 예측하고 새로운 데이터가 제공될 때 출력을 지속적으로 업데이트합니다.

예를 들어 소매 웹사이트에서는 기계 학습 알고리즘 구매 내역을 기반으로 추천을 제공하여 소비자 구매 결정에 영향을 미칩니다. IBM, Amazon, Google, Meta 및 Netflix를 포함한 많은 소매업체의 전자상거래 플랫폼은 인공 신경망(ANN)을 사용하여 맞춤형 추천을 제공합니다. 그리고 소매업체는 다음의 데이터를 자주 활용합니다. 잡담 ML 및 가상 비서와 협력하여 자연어 처리 (NLP) 기술을 통해 사용자의 쇼핑 경험을 자동화합니다.

기계 학습 유형

기계 학습 알고리즘은 감독 학습, 비지도 학습, 준지도 학습, 자기 감독 및 강화 학습의 XNUMX가지 광범위한 범주로 분류됩니다.

1. 지도 머신러닝

감독되는 기계 학습 모델이 레이블이 지정된 데이터 세트(즉, 목표 또는 결과 변수가 알려져 있음)에 대해 훈련되는 일종의 기계 학습입니다. 예를 들어 데이터 과학자가 토네이도 예측을 위한 모델을 구축하는 경우 입력 변수에는 날짜, 위치, 온도, 바람의 흐름 패턴 등이 포함될 수 있으며 출력은 해당 날짜에 기록된 실제 토네이도 활동이 됩니다.

지도 학습은 일반적으로 위험 평가, 이미지 인식, 예측 분석 사기 탐지 등 여러 유형의 알고리즘으로 구성됩니다.

  • 회귀 알고리즘—실제 또는 연속 값(예: 온도, 급여) 간의 선형 관계를 식별하여 출력 값을 예측합니다. 회귀 알고리즘에는 선형 회귀, 랜덤 포레스트, 그래디언트 부스팅 및 기타 하위 유형이 포함됩니다.
  • 분류 알고리즘— 입력 데이터에 라벨을 지정하여 범주형 출력 변수(예: "정크" 또는 "정크 아님")를 예측합니다. 분류 알고리즘에는 로지스틱 회귀, k-최근접 이웃, SVM(지원 벡터 머신) 등이 포함됩니다.
  • 나이브 베이즈 분류기—대규모 데이터 세트에 대한 분류 작업을 활성화합니다. 또한 특정 클래스 또는/카테고리의 입력 분포를 모델링하는 생성 학습 알고리즘 제품군의 일부입니다. Naive Bayes 알고리즘에는 다음이 포함됩니다. 결정 트리, 실제로 회귀 및 분류 알고리즘을 모두 수용할 수 있습니다.
  • 신경망—자연어 번역, 이미지 인식, 음성 인식 및 이미지 생성과 같은 프로세스를 촉진할 수 있는 수많은 연결된 처리 노드를 사용하여 인간 두뇌가 작동하는 방식을 시뮬레이션합니다.
  • 랜덤 포레스트 알고리즘- 여러 의사결정 트리의 결과를 결합하여 값이나 카테고리를 예측합니다.

2. 비지도 머신러닝

감독되지 않은 학습 Apriori, GMM(가우스 혼합 모델) 및 PCA(주성분 분석)와 같은 알고리즘은 레이블이 지정되지 않은 데이터 세트에서 추론을 도출하여 탐색적 데이터 분석을 촉진하고 패턴 인식 및 예측 모델링을 가능하게 합니다.

가장 일반적인 비지도 학습 방법은 클러스터링 알고리즘을 사용하여 값 유사성에 따라 데이터 포인트를 분류하는 클러스터 분석입니다(예: 고객 세분화 또는 이상 감지). 연관 알고리즘을 사용하면 데이터 과학자는 대규모 데이터베이스 내의 데이터 개체 간의 연관을 식별하여 데이터 시각화 및 차원 축소를 촉진할 수 있습니다.

  • K- 평균 클러스터링- 데이터 포인트를 K 그룹에 할당합니다. 여기서 주어진 중심에 가장 가까운 데이터 포인트는 동일한 범주 아래에 클러스터링되고 K는 크기와 세분성 수준을 기반으로 클러스터를 나타냅니다. K-평균 클러스터링은 일반적으로 시장 분할, 문서 클러스터링, 이미지 분할 및 이미지 압축에 사용됩니다.
  • 계층 적 클러스터링— 집합적 클러스터링(데이터 포인트가 처음에 그룹으로 분리된 다음 하나의 클러스터가 남을 때까지 유사성을 기반으로 반복적으로 병합되는 집합적 클러스터링)과 단일 데이터 클러스터가 데이터 포인트 간의 차이에 따라 분할되는 분할 클러스터링(dividive Clustering)을 포함한 일련의 클러스터링 기술에 대해 설명합니다. .
  • 확률적 클러스터링—특정 분포에 속할 가능성을 기준으로 데이터 포인트를 그룹화하여 밀도 추정 또는 "소프트" 클러스터링 문제를 해결하는 데 도움이 됩니다.

비지도 학습 모델은 종종 "이 제품을 구매한 고객도 구매했습니다..." 유형의 추천 시스템 뒤에 있습니다.

3. 자기주도형 머신러닝

자기 지도 학습(SSL)을 사용하면 모델이 주석이 있거나 레이블이 지정된 대규모 데이터세트를 요구하는 대신 레이블이 없는 데이터를 기반으로 스스로 학습할 수 있습니다. 예측 또는 프리텍스트 학습 알고리즘이라고도 하는 SSL 알고리즘은 입력의 한 부분을 다른 부분에서 학습하여 자동으로 레이블을 생성하고 감독되지 않은 문제를 지도된 문제로 변환합니다. 이러한 알고리즘은 모델을 훈련하는 데 필요한 레이블이 지정된 훈련 데이터의 양이 매우 클 수 있는(때로는 엄청나게 클 수 있는) 컴퓨터 비전 및 NLP와 같은 작업에 특히 유용합니다.

4. 강화 학습

강화 학습라고도 인간 피드백을 통한 강화 학습(RLHF), 보상과 처벌 시스템을 사용하여 알고리즘을 훈련시키는 동적 프로그래밍의 한 유형입니다. 강화 학습을 배포하기 위해 에이전트는 미리 결정된 목표를 달성하기 위해 특정 환경에서 조치를 취합니다. 에이전트는 확립된 측정항목(일반적으로 점수)을 기반으로 해당 작업에 대해 보상을 받거나 불이익을 받으며 에이전트가 좋은 작업을 계속하고 나쁜 작업을 삭제하도록 장려합니다. 반복을 통해 에이전트는 최상의 전략을 학습합니다.

강화 학습 알고리즘은 비디오 게임 개발에서 흔히 사용되며 인간 작업을 복제하는 방법을 로봇에게 가르치는 데 자주 사용됩니다.

5. 준지도 학습

다섯 번째 유형의 기계 학습 기술은 지도 학습과 비지도 학습의 조합을 제공합니다.

준지도 학습 알고리즘은 작은 레이블이 있는 데이터 세트와 레이블이 없는 대규모 데이터 세트에 대해 훈련되며, 레이블이 있는 데이터는 레이블이 없는 더 큰 데이터 본문에 대한 학습 프로세스를 안내합니다. 준지도 학습 모델은 비지도 학습을 사용하여 데이터 클러스터를 식별한 다음 지도 학습을 사용하여 클러스터에 레이블을 지정할 수 있습니다.

생성적 적대 네트워크(GAN) -깊은 학습 두 개의 신경망을 훈련하여 레이블이 지정되지 않은 데이터를 생성하는 도구는 준지도 기계 학습의 예입니다.

유형에 관계없이 ML 모델은 기업 데이터에서 데이터 통찰력을 얻을 수 있지만 인간/데이터 편견에 대한 취약성으로 인해 책임감 있는 AI 관행이 조직의 필수 사항이 됩니다.

watstonx.ai를 사용하여 다양한 기계 학습 모델을 관리하세요.

개발자부터 사용자, 규제 기관에 이르기까지 거의 모든 사람이 AI 기술과 직접 상호 작용하는지 여부에 관계없이 어느 시점에서는 기계 학습 애플리케이션에 참여합니다. 그리고 ML 기술의 채택이 가속화되고 있습니다. 그만큼 글로벌 머신러닝 시장 가치 평가 19년에는 2022억 달러, 188년에는 2030억 달러에 이를 것으로 예상됩니다(CAGR 37% 이상).

ML 채택 규모와 비즈니스 영향 증가로 인해 AI 및 ML 기술에 대한 이해는 지속적이고 매우 중요한 약속이 되었으며, 기술이 발전함에 따라 세심한 모니터링과 시기적절한 조정이 필요합니다. IBM®과 함께 watsonx.ai™ AI 스튜디오를 통해 개발자는 ML 알고리즘과 프로세스를 쉽게 관리할 수 있습니다.

IBM watsonx™ AI 및 데이터 플랫폼의 일부인 IBM watsonx.ai는 새로운 생성 AI 기능과 차세대 엔터프라이즈 스튜디오를 결합하여 AI 빌더가 짧은 데이터로 AI 모델을 교육, 검증, 조정 및 배포할 수 있도록 지원합니다. 시간의 일부. Watsonx.ai는 기업이 최적의 실제 AI 성능을 위해 데이터 통찰력을 활용하는 데 도움이 되는 고급 데이터 생성 및 분류 기능을 팀에 제공합니다.

데이터 확산 시대에 AI와 머신러닝은 기술 혁신과 비즈니스 경쟁만큼이나 일상적인 비즈니스 운영에도 필수적입니다. 그러나 현대 사회의 새로운 기둥으로서 이는 기업 IT 인프라를 다양화하고 기업과 이에 의존하는 사람들의 이익을 위해 작동하는 기술을 개발할 수 있는 기회이기도 합니다.

watsonx.ai AI 스튜디오 살펴보기


인공 지능에 대해 자세히 알아보기




승리하는 조직이 따라야 할 고객 서비스 동향

4 분 읽기 - 최신 고객 서비스 동향에 주의를 기울이는 것은 조직이 변화하는 고객 기대에 부응할 준비가 되어 있음을 보장합니다. 코로나19 팬데믹, 사회적 영향, 브랜드 전환의 용이성으로 인해 고객 충성도가 약해지고 있습니다. 그 어느 때보다 조직은 고객 서비스 경험의 변화를 파악하여 고객 만족도를 높이고 증가하는 고객 요구 사항을 충족해야 합니다. 2023년 Gartner 연구에 따르면 리더의 58%가 비즈니스 성장을 가장 중요한 목표 중 하나로 꼽았습니다.…




알아야 할 다섯 가지 오픈 소스 AI 도구

5 분 읽기 - 오픈소스 인공지능(AI)은 소스코드를 누구나 자유롭게 사용, 수정, 배포할 수 있는 AI 기술을 말한다. AI 알고리즘, 사전 훈련된 모델 및 데이터 세트를 공개적으로 사용하고 실험할 수 있게 되면 창의적인 AI 애플리케이션은 자원 봉사 열성팬 커뮤니티가 기존 작업을 기반으로 구축하고 실용적인 AI 솔루션 개발을 가속화하면서 등장합니다. 결과적으로 이러한 기술은 많은 기업 사용 사례에서 복잡한 문제를 처리하는 최고의 도구로 이어지는 경우가 많습니다.…




IBM Tech Now: 11년 2023월 XNUMX일

<1 분 읽기 - 기술 세계의 가장 뛰어난 최신 뉴스와 발표를 소개하는 비디오 웹 시리즈인 IBM Tech Now에 오신 것을 환영합니다. 새로운 IBM Tech Now 비디오가 게시될 때마다 알림을 받으려면 YouTube 채널을 구독하세요. IBM Tech Now: 에피소드 90 이 에피소드에서는 다음 주제를 다룹니다. IBM Quantum Heron IBM Quantum System Two watsonx.governance의 GA 최신 정보는 IBM 블로그 공지에서 확인하실 수 있습니다…




소프트웨어 정의 차량: 자동차 산업의 차세대 진화를 뒷받침하는 아키텍처

4 분 읽기 - 이제 점점 더 많은 소비자가 자신의 차량이 다른 스마트 장치에서 제공하는 것과 다르지 않은 경험을 제공하기를 기대합니다. 그들은 디지털 생활에 완전히 통합되기를 원하며 주로 또는 전적으로 소프트웨어를 통해 운영을 관리하고 기능을 추가하며 새로운 기능을 활성화할 수 있는 차량을 원합니다. GMI 보고서에 따르면 글로벌 소프트웨어 정의 차량(SDV) 시장은 22.1년부터 2023년까지 연평균 성장률(CAGR) 2032%를 달성할 것으로 예상됩니다. 이러한 성장은 고급 차량에 대한 수요 증가에 의해 주도됩니다.

IBM 뉴스레터

새로운 트렌드에 대한 최신 사고 리더십과 통찰력을 제공하는 뉴스레터와 주제 업데이트를 받아보세요.

지금 가입

더 많은 뉴스 레터

spot_img

최신 인텔리전스

spot_img