제퍼넷 로고

데이터 과학자로서 알아야 할 기계 학습의 3 가지 구성 요소

시간


살펴보기

  • 기계 학습 시스템은 관리해야하는 여러 빌딩 블록으로 구성됩니다.
  • 데이터 과학자로 작업 할 머신 러닝의 세 가지 주요 구성 요소에 대해 알아보십시오.

개요

기계 학습 프로젝트는 어떻게 작동합니까? 기계 학습 또는 인공 지능 (AI) 시스템을 만드는 데 필요한 여러 가지 구성 요소는 무엇입니까? 이것은 내가 현장에서 처음 일하는 동안 개인적으로 어려움을 겪었던 주제입니다.

기계 학습 모델을 만드는 방법을 알고 있었지만 실제 기계 학습 프로젝트가 실제로 어떻게 작동했는지 전혀 알지 못했습니다. 내가 그 과정을 겪었을 때 그것은 꽤 계시였습니다! 그리고 시간이 지남에 따라 대부분의 데이터 과학 및 기계 학습 초보자가 기계 학습 시스템의 뉘앙스를 파악하는 데 어려움을 겪었습니다.

기억하십시오 – 단지 모델을 만드는 것이 아닙니다! 성공적인 머신 러닝과 AI 시스템을 만드는 데 필요한 많은 것들이 있습니다. 무엇보다도 하드웨어와 소프트웨어의 융합입니다. 성공적인 머신 러닝 시스템을 구성하는 핵심 구성 요소는 무엇입니까?

Building_blocks_machine_learning

이것이이 기사에서 자세히 다룰 것입니다. 머신 러닝 또는 AI 시스템에서 이러한 다양한 구성 요소에 대한 개요를 제공 한 다음 자율 주행 자동차를 통해 이러한 구성 요소를 이해합니다.

이 기사와 우리가 다룰 개념은 무료 'AI 및 ML 소개' 강좌. AI와 머신 러닝의 다양한 개념을 익히기에 좋은 곳입니다.

그리고 머신 러닝의 세 가지 주요 구성 요소는 다음과 같습니다.

  • 기계 학습 빌딩 블록 # 1 : 입력 캡처
  • 기계 학습 빌딩 블록 # 2 : 데이터 처리 및 저장
  • 기계 학습 빌딩 블록 # 3 : 출력 또는 상호 작용 장치

기계 학습 빌딩 블록 # 1 : 입력 캡처

예상 한대로 모든 머신 러닝 시스템에는 많은 데이터가 필요합니다. 궁극적으로 캡처 한 데이터를 기반으로 결정을 내립니다. 또한 환경, 주변 조건, 사용자 입력 등에 대한 데이터를 캡처해야합니다.

따라서 머신 러닝 또는 AI 시스템의 첫 번째 구성 요소는 시스템에서 캡처하고 입력하는 방식입니다.

이 입력은 어떻게 생겼습니까? 여기에는 이미지 캡처 카메라, GPS 위치, 모바일 애플리케이션의 사용자 입력 등과 같은 다양한 센서가 포함될 수 있습니다. 올바른 입력을 선택하려면 다음과 같은 주요 질문을해야합니다.

  • 어떤 데이터를 캡처해야합니까?
  • 이 데이터를 얼마나 자주 캡처해야합니까?
  • 이 데이터는 얼마나 빨리 흐를까요?
  • 이 데이터를 캡처하는 가장 좋은 방법은 무엇입니까?

때로는 동일한 데이터를 캡처하는 여러 가지 방법이 있습니다. 예를 들어, 날씨 정보를 캡처하기 위해 자동차의 센서를 사용하거나 자동차의 GPS 좌표를 기반으로 인터넷에서 직접 센서를 가져올 수 있습니다.

선호하는 데이터를 결정하기 전에 데이터를 캡처하는 다양한 방법의 장단점을 평가하는 것이 좋습니다.

기계 학습 빌딩 블록 # 2 : 데이터 처리 및 저장 (에지 및 클라우드)

입력 단위에서이 데이터를 캡처 한 후에는 데이터를 저장하거나 계산을 실행해야합니다. 그것은 기본적으로 우리가 작업 할 때 끓는 선택입니다. 기계 학습 프로젝트!

이 두 가지 (프로세싱 또는 저장)는 일반적으로 "Edge on Edge"라고하는 시스템에서 발생하거나 클라우드에서 발생할 수 있습니다. 다시, 우리는 우리 앞에 몇 가지 선택이 있습니다. 우리는 다음을 결정해야합니다.

  • 에지에 어떤 데이터가 저장됩니까?
  • 가장자리에서 어떤 계산이 발생합니까? 여기에서는 일반적으로 컴퓨팅 환경에 제한이 있습니다 (모든 사람이 Google의 무제한 컴퓨팅 리소스를 가지고있는 것은 아닙니다)!
  • 클라우드는 어떻게 되나요?

일반적으로 인터넷에 연결되어 있지 않거나 시스템으로 업그레이드하지 않아도 중요한 작업이 발생하면 항상 가장자리에 있어야합니다.

여기에는 즉각적인 의사 결정, 경고 또는 장치에서 원하는 다른 형태의 모니터링과 같은 것들이 포함됩니다. 클라우드에서보다 포괄적 인 데이터 저장 및 계산. 데이터 과학자들이 일반적으로 다양한 응용을 적용하는 곳 기계 학습 기술 시스템을 개선하기 위해. 모든 데이터 레이크, 데이터웨어 하우스 등은 일반적으로 클라우드에도 있습니다.

기계 학습 빌딩 블록 # 3 : 출력 또는 상호 작용 장치

마지막으로 성공적인 AI 또는 머신 러닝 시스템에는 출력 또는 상호 작용 단위가 있습니다. 이것은 머신 러닝 시스템이 외부 세계와 상호 작용하고 행동을 취하는 단위입니다.

이것은 디스플레이, 음성 출력 또는 비공식 로봇 동작의 형태 일 수 있습니다. 일반적으로 머신 러닝 시스템의 출력에는 몇 가지 설계 고려 사항이 있습니다.

예를 들어, 차량이 확실하게 환경을 결정하거나 읽을 수없는 경우 주요 질문에 답변해야합니다.

  • 시스템은 어떻게해야합니까?
  • 먼저 중지해야합니까, 아니면 사용자에게 경고해야합니까?
  • 얼마나 자주 그리고 어떤 세부 정보를 사용자에게 알려야합니까?

이들은 머신 러닝 시스템의 출력 레이어에서 공통적으로 고려해야 할 핵심 질문 중 일부입니다.

사례 연구 :자가 운전 차량의 빌딩 블록

자율 주행 자동차의 예를 들어 각 빌딩 블록을 자세히 살펴 보겠습니다. 이를 통해 실제 환경에서 머신 러닝 또는 AI 시스템의 작동 방식을보다 실질적으로 이해할 수 있습니다.

그렇다면 첫 번째 빌딩 블록 또는 구성 요소는 무엇입니까?

당신은 그것을 추측 – 입력! drive.ai의자가 운전 차량을 확인하십시오.

machine_learning_building_blocks_car

여기에서 볼 수 있듯이이 자율 주행 차량에는 머신 러닝 시스템의 입력 역할을하는 많은 센서가 있습니다. 이 센서는 차량 상단에 파란색으로 표시됩니다. 이를 LiDAR 또는 Light Detection and Ranging이라고합니다. 이외에도 날씨, 자동차 안팎의 장애물, 차선 감지 등과 같은 더 많은 정보를 캡처하는 다른 센서가 있습니다.

자율 주행 _ 자동차 _ 기계 _ 학습

그런 다음 자동차 자체에 컴퓨팅 및 스토리지가 있으므로 자동차는 다음과 같은 결정을 내릴 수 있습니다.

  • 얼마나 조종해야합니까?
  • 어떤 속도로 달릴까요?
  • 방해물은 무엇입니까?
  • 이러한 장애물을 처리하는 방법?

클라우드에는 스토리지 및 컴퓨팅 계층도 있으며, 시간이 지남에 따라 구동 알고리즘을 개선하는 역할을합니다.

마지막으로 자동차 주변 사람들에게 메시지를 표시하는 화면과 같은 여러 출력 구성 요소가 표시됩니다. 차량을 전진 구동하기 위해 로봇 프로세스에 의해 취해지는 조치도 있습니다. 이 단계에서 필요한 여러 레이어의 그림은 다음과 같습니다.

Building_blocks_ml

성공적인자가 운전 차량을 만드는 데 필요한 다른 많은 볼트와 너트가 있습니다. 그러나이 예제를 통해 실제 머신 러닝 시스템의 전반적인 아이디어가 어떻게 작동하고이를 구현하는 데 필요한 주요 구성 요소를 보여 드리고자합니다.

최종 메모

꽤 매력적입니까? 앞서 말했듯이 기계 학습 프로젝트는 단지 모델을 만드는 것이 아닙니다. 대부분의 데이터 과학 애호가들이 알지 못하는 것이 훨씬 더 많습니다. 머신 러닝 전문가로서의 역할을 수행하려면이 실용적인 지식이 필요합니다.

여기 당신에게 도전이 있습니다. 자율 주행 자동차의 다양한 구성 요소를 이해 했으므로 이제 자체적으로 바닥을 탐색하고 이동하는 영역을 청소할 수있는 지능형 진공 청소기의 구성 요소를 설계해야합니다. 재미있게 만들어보세요!

이 기사에 대해 질문이나 의견이 있으시면 언제든지 알려주세요.

모바일 APP에서이 기사를 읽을 수도 있습니다. Google Play에서 그것을 얻을

관련 기사

출처 : https://www.analyticsvidhya.com/blog/2020/06/3-building-blocks-machine-learning-data-scientist/

spot_img

최신 인텔리전스

spot_img