제퍼넷 로고

Amazon SageMaker Canvas를 사용하여 코드 없는 기계 학습으로 기계 오류 유형 예측

시간

일반적인 기계 고장 유형을 예측하는 것은 제조 산업에서 매우 중요합니다. 주어진 실패 유형과 연결된 제품의 특성 세트가 주어지면 이러한 속성을 기계 학습(ML) 모델에 제공할 때 실패 유형을 예측할 수 있는 모델을 개발할 수 있습니다. ML은 통찰력에 도움이 될 수 있지만 지금까지는 기계 오류 유형을 예측하기 위한 모델을 구축하기 위해 ML 전문가가 필요했으며, 이러한 모델이 없으면 기업이 효율성이나 개선을 위해 필요로 하는 수정 조치를 지연시킬 수 있습니다.

이 게시물에서는 비즈니스 분석가가 다음을 사용하여 기계 오류 유형 예측 ML 모델을 구축하는 방법을 보여줍니다. Amazon SageMaker 캔버스. Canvas는 ML 경험이 필요하거나 한 줄의 코드를 작성할 필요 없이 직접 모델을 빌드하고 정확한 ML 예측을 생성할 수 있는 시각적 포인트 앤 클릭 인터페이스를 제공합니다.

솔루션 개요

여러분이 대규모 제조 조직의 유지 관리 팀에 배정된 비즈니스 분석가라고 가정해 보겠습니다. 유지 관리 팀에서 일반적인 오류를 예측하는 데 도움을 요청했습니다. 그들은 주어진 실패 유형과 관련된 특성을 포함하는 과거 데이터 세트를 제공했으며 미래에 어떤 실패가 발생할지 예측하기를 원합니다. 고장 유형에는 고장 없음, 과도 및 정전이 있습니다. 데이터 스키마는 다음 표에 나열되어 있습니다.

열 이름 데이터 형식 상품 설명
UID INT 1–10,000 범위의 고유 식별자
제품 ID STRING 낮음, 중간 또는 높음을 나타내는 문자(L, M 또는 H)로 구성되어 제품 품질 변형 및 변형별 일련 번호
유형 STRING L, M 또는 H로만 구성된 productID와 관련된 이니셜 문자
기온 [K] 소수 켈빈으로 지정된 기온
공정 온도 [K] 소수 켈빈으로 지정된 특정 유형의 제품 품질을 보장하기 위해 정밀하게 제어되는 온도
회전 속도 [rpm] 소수 축을 중심으로 회전하는 물체의 회전 속도는 물체의 회전 수를 시간으로 나눈 값으로, 분당 회전수로 지정됩니다.
토크 [Nm] 소수 반경을 통한 기계 회전력(뉴턴 미터로 표시)
공구 마모 [분] INT 분 단위로 표시되는 공구 마모
실패 유형(대상) STRING 고장 없음, 정전 또는 과부하 고장 없음

장애 유형이 식별되면 기업은 시정 조치를 취할 수 있습니다. 이렇게 하려면 표에 설명된 대로 제품의 특정 특성이 포함된 CSV 파일에 있는 데이터를 사용합니다. Canvas를 사용하여 다음 단계를 수행합니다.

  1. 유지 관리 데이터 세트를 가져옵니다.
  2. 예측 기계 유지 관리 모델을 학습하고 구축합니다.
  3. 모델 결과를 분석합니다.
  4. 모델에 대한 예측을 테스트합니다.

사전 조건

다음을 가진 클라우드 관리자 AWS 계정 다음 전제 조건을 완료하려면 적절한 권한이 있어야 합니다.

  1. 배포 아마존 세이지 메이커 도메인 지침은 다음을 참조하십시오. Amazon SageMaker 도메인에 온보딩.
  2. 캔버스를 시작합니다. 지침은 다음을 참조하십시오. Amazon SageMaker Canvas 설정 및 관리(IT 관리자용).
  3. Canvas에 대한 CORS(교차 출처 리소스 공유) 정책을 구성합니다. 지침은 다음을 참조하십시오. 사용자에게 로컬 파일 업로드 기능 제공.

데이터세트 가져오기

먼저, 유지 관리 데이터 세트 파일을 검토하여 모든 데이터가 있는지 확인하십시오.

Canvas는 시작하는 데 도움이 되도록 애플리케이션에 여러 샘플 데이터 세트를 제공합니다. 실험할 수 있는 SageMaker 제공 샘플 데이터 세트에 대해 자세히 알아보려면 다음을 참조하십시오. 샘플 데이터세트 사용. 샘플 데이터 세트를 사용하는 경우(canvas-sample-maintenance.csv) Canvas 내에서 사용할 수 있으므로 유지 관리 데이터 세트를 가져올 필요가 없습니다.

다양한 데이터 소스의 데이터를 Canvas로 가져올 수 있습니다. 자체 데이터세트를 사용하려는 경우 다음 단계를 따르세요. Amazon SageMaker Canvas에서 데이터 가져오기.

이 게시물에서는 다운로드한 전체 유지 관리 데이터 세트를 사용합니다.

  1. 에 로그인 AWS 관리 콘솔, Canvas에 액세스할 수 있는 적절한 권한이 있는 계정을 사용합니다.
  2. Canvas 콘솔에 로그인합니다.
  3. 왼쪽 메뉴에서 수입.
  4. 왼쪽 메뉴에서 가이드라가 선택하고 maintenance_dataset.csv 파일.
  5. 왼쪽 메뉴에서 데이터 가져 오기 Canvas에 업로드합니다.

데이터세트 가져오기

가져오기 프로세스는 약 10초가 소요됩니다(데이터 세트 크기에 따라 다를 수 있음). 완료되면 데이터세트가 Ready 상태.

가져온 데이터세트가 다음과 같은지 확인한 후 ready, 당신은 당신의 모델을 만들 수 있습니다.

모델 빌드 및 학습

모델을 만들고 학습시키려면 다음 단계를 완료하십시오.

  1. 왼쪽 메뉴에서 새 모델, 모델 이름을 입력합니다.
  2. 왼쪽 메뉴에서 만들기.
  3. 선택 maintenance_dataset.csv 데이터 세트 및 선택 데이터 세트 선택.
    모델 보기에서 모델을 만들고 예측을 생성하는 데 사용하는 XNUMX단계에 해당하는 XNUMX개의 탭을 볼 수 있습니다. 선택, 짓다, 분석예측.
  4. 선택 탭을 선택 maintenance_dataset.csv 이전에 업로드한 데이터세트를 선택하고 데이터 세트 선택.
    이 데이터 세트에는 9개의 열과 10,000개의 행이 있습니다. Canvas는 자동으로 빌드 단계로 이동합니다.
  5. 이 탭에서 우리의 경우 대상 열을 선택합니다. 실패 유형.유지 관리 팀은 이 열이 기존 기계의 기록 데이터를 기반으로 일반적으로 표시되는 오류 유형을 나타냅니다. 이것이 예측하도록 모델을 훈련시키려는 것입니다. Canvas는 이것이 다음임을 자동으로 감지합니다. 3 카테고리 문제(또는 다중 클래스 분류). 잘못된 모델 유형이 감지되면 다음을 사용하여 수동으로 변경할 수 있습니다. 유형 변경 옵션을 선택합니다.
    이 데이터 세트는 No Failure 클래스에 대해 불균형이 매우 높으며, 이는 이라는 열을 보면 알 수 있습니다. 실패 유형. Canvas와 기본 AutoML 기능은 데이터 세트 불균형을 부분적으로 처리할 수 있지만 이로 인해 성능이 일부 왜곡될 수 있습니다. 추가 다음 단계로 다음을 참조하십시오. Amazon SageMaker Data Wrangler로 기계 학습을 위한 데이터 균형 조정. 공유 링크의 단계에 따라 다음을 실행할 수 있습니다. 아마존 세이지 메이커 스튜디오 SageMaker 콘솔에서 앱을 실행하고 다음 내에서 이 데이터세트를 가져옵니다. Amazon SageMaker 데이터 랭글러 균형 데이터 변환을 사용한 다음 균형 데이터 세트를 다시 Canvas로 가져오고 다음 단계를 계속합니다. Canvas가 불균형 데이터 세트도 처리할 수 있음을 보여주기 위해 이 게시물에서 불균형 데이터 세트를 진행하고 있습니다.
    페이지 하단에서 누락 및 불일치 값, 고유 값, 평균 및 중앙값을 포함하여 데이터 세트의 일부 통계를 볼 수 있습니다. 예측에 사용하지 않으려면 열을 선택 해제하여 일부 열을 삭제할 수도 있습니다.
    이 섹션을 탐색한 후에는 모델을 훈련할 시간입니다! 완전한 모델을 작성하기 전에 빠른 모델을 학습하여 모델 성능에 대한 일반적인 아이디어를 얻는 것이 좋습니다. 빠른 모델은 특히 사용 사례에 대한 ML 모델 교육의 가치를 증명하려는 경우 정확도보다 속도를 우선시하기 위해 모델과 초매개변수의 조합을 더 적게 교육합니다. 50,000행보다 큰 모델에는 빠른 빌드 옵션을 사용할 수 없습니다.
  6. 왼쪽 메뉴에서 빠른 빌드.

모델 빌딩 진행 중

이제 2~15분 정도 기다리면 됩니다. 완료되면 Canvas가 자동으로 분석 탭을 클릭하여 빠른 훈련 결과를 보여줍니다. 빠른 빌드 추정을 사용하여 수행된 분석은 모델이 99.2%의 시간 동안 올바른 실패 유형(결과)을 예측할 수 있다고 합니다. 약간 다른 값을 경험할 수 있습니다. 예상됩니다.

첫 번째 탭에 초점을 맞춰 보겠습니다. 살펴보기. 보여주는 탭입니다. 칼럼 임팩트, 또는 대상 열을 예측할 때 각 열의 예상 중요도. 이 예에서 토크[Nm] 및 회전 속도[rpm] 열은 어떤 유형의 고장이 발생할지 예측하는 데 가장 큰 영향을 미칩니다.

분석 - 개요

모델 성능 평가

로 이동할 때 점수 분석의 일부에서 실제 값에 대한 예측 값의 분포를 나타내는 플롯을 볼 수 있습니다. 대부분의 실패는 실패 없음 범주에 속합니다. Canvas가 SHAP 기준선을 사용하여 ML에 설명 가능성을 가져오는 방법에 대해 자세히 알아보려면 다음을 참조하세요. Amazon SageMaker Canvas에서 모델 성능 평가, 만큼 잘 설명 가능성을위한 SHAP 기준.
모델 메트릭 평가

Canvas는 훈련 전에 원본 데이터 세트를 훈련 세트와 검증 세트로 나눕니다. 점수는 Canvas가 모델에 대해 유효성 검사 세트를 실행한 결과입니다. 이것은 실패 유형을 선택할 수 있는 대화식 인터페이스입니다. 선택하면 과변형 실패 그래픽에서 해당 모델이 84%의 시간을 식별한다는 것을 알 수 있습니다. 이것은 조치를 취하기에 충분합니다. 아마도 운영자나 엔지니어가 더 확인하도록 할 것입니다. 당신은 선택할 수 있습니다 정전 그래픽에서 추가 해석 및 조치에 대한 각 점수를 확인합니다.

실패 유형과 모델이 일련의 입력을 기반으로 실패 유형을 얼마나 잘 예측하는지에 관심이 있을 수 있습니다. 결과를 자세히 보려면 ​​다음을 선택하십시오. 고급 메트릭. 그러면 결과를 더 자세히 조사할 수 있는 매트릭스가 표시됩니다. ML에서는 이것을 혼란 매트릭스.

고급 측정항목

이 매트릭스는 기본 클래스인 No Failure로 설정됩니다. 에 클래스 메뉴에서 Overstrain Failure 및 Power Failure의 다른 두 가지 오류 유형에 대한 고급 메트릭을 보도록 선택할 수 있습니다.

ML에서 모델의 정확도는 올바른 예측의 수를 전체 예측 수로 나눈 값으로 정의됩니다. 파란색 상자는 알려진 결과가 있는 테스트 데이터의 하위 집합에 대해 모델이 만든 올바른 예측을 나타냅니다. 여기서 우리는 모델이 특정 기계 고장 유형을 예측한 시간의 백분율에 관심이 있습니다. 실패 없음) 실제로 그 실패 유형(실패 없음). ML에서 이를 측정하는 데 사용되는 비율은 TP/(TP + FN)입니다. 이것은 소환. 기본 케이스인 No Failure의 경우 1,923개의 전체 레코드 중 1,926개의 올바른 예측이 있었고 결과는 99%였습니다. 소환. 또는 Overstrain Failure 클래스에는 32개 중 38개가 있었고 결과적으로 84% 소환. 마지막으로 정전 등급에서는 16개 중 19개가 발생하여 84%의 소환.

이제 두 가지 옵션이 있습니다.

  1. 이 모델을 사용하여 다음을 선택하여 일부 예측을 실행할 수 있습니다. 예측.
  2. 이 모델의 새 버전을 만들어 학습할 수 있습니다. 표준 빌드 옵션. 이것은 훨씬 더 오래(약 1-2시간) 소요되지만 데이터, 알고리즘 및 조정 반복에 대한 전체 AutoML 검토를 거치기 때문에 더 강력한 모델을 제공합니다.

실패를 예측하려고 하고 모델이 84%의 시간에 실패를 정확하게 예측하기 때문에 모델을 사용하여 가능한 실패를 자신 있게 식별할 수 있습니다. 따라서 옵션 1로 진행할 수 있습니다. 자신이 없다면 데이터 과학자가 Canvas에서 수행한 모델링을 검토하고 옵션 2를 통해 잠재적인 개선 사항을 제안하도록 할 수 있습니다.

예측 생성

이제 모델이 학습되었으므로 예측 생성을 시작할 수 있습니다.

  1. 왼쪽 메뉴에서 예측 하단의 분석 페이지를 선택하거나 예측 탭.
  2. 왼쪽 메뉴에서 데이터 세트 선택을 선택하고 maintenance_dataset.csv 파일.
  3. 왼쪽 메뉴에서 예측 생성.

Canvas는 이 데이터 세트를 사용하여 예측을 생성합니다. 일반적으로 훈련과 테스트 모두에 동일한 데이터 세트를 사용하지 않는 것이 좋지만 이 경우 단순성을 위해 동일한 데이터 세트를 사용할 수 있습니다. 또는 훈련에 사용하는 원본 데이터 세트에서 일부 레코드를 제거하고 CSV 파일의 해당 레코드를 사용하고 여기에서 일괄 예측에 공급하여 사후 훈련 테스트에 동일한 데이터 세트를 사용하지 않도록 할 수 있습니다.

일괄 예측
몇 초 후에 예측이 완료됩니다. Canvas는 각 데이터 행에 대한 예측과 예측이 정확할 확률을 반환합니다. 당신은 선택할 수 있습니다 시사 예측을 보거나 다운로드 전체 출력이 포함된 CSV 파일을 다운로드합니다.

다운로드 예측
다음을 선택하여 값을 하나씩 예측하도록 선택할 수도 있습니다. 단일 예측 대신 일괄 예측. Canvas는 각 기능에 대한 값을 수동으로 제공하고 예측을 생성할 수 있는 보기를 보여줍니다. 이는 예를 들어 다음과 같은 가정 시나리오와 같은 상황에 이상적입니다. 공구 마모가 고장 유형에 어떤 영향을 줍니까? 공정 온도가 증가하거나 감소하면 어떻게 됩니까? 회전 속도가 변경되면 어떻게 됩니까?

단일 예측

표준 빌드

  표준 빌드 옵션은 속도보다 정확도를 선택합니다. 모델의 아티팩트를 데이터 과학자 및 ML 엔지니어와 공유하려는 경우 다음에 표준 빌드를 생성할 수 있습니다.

  1. 왼쪽 메뉴에서 버전 추가
    표준 빌드 - 버전 추가
  2. 새 버전을 선택하고 표준 빌드.표준 빌드를 선택
  3. 표준 빌드를 만든 후 추가 평가 및 반복을 위해 데이터 과학자 및 ML 엔지니어와 모델을 공유할 수 있습니다.

모델 공유

정리

미래에 발생하지 않도록 세션 요금, Canvas에서 로그아웃합니다.
캔버스에서 로그아웃

결론

이 게시물에서는 비즈니스 분석가가 유지 관리 데이터를 사용하여 Canvas로 기계 고장 유형 예측 모델을 생성하는 방법을 보여주었습니다. Canvas를 사용하면 안정성 엔지니어와 같은 비즈니스 분석가가 정확한 ML 모델을 생성하고 코드가 없는 시각적 포인트 앤 클릭 인터페이스를 사용하여 예측을 생성할 수 있습니다. 분석가는 자신의 모델을 데이터 과학자 동료와 공유하여 이를 한 단계 더 높일 수 있습니다. 데이터 과학자는 Studio에서 Canvas 모델을 보고 Canvas가 선택한 항목을 탐색하고, 모델 결과를 검증하고, 몇 번의 클릭으로 모델을 프로덕션으로 가져올 수도 있습니다. 이를 통해 ML 기반 가치 창출을 가속화하고 개선된 결과를 더 빠르게 확장할 수 있습니다.

Canvas 사용에 대해 자세히 알아보려면 구축, 공유, 배포: 비즈니스 분석가와 데이터 과학자가 코드 없는 ML 및 Amazon SageMaker Canvas를 사용하여 시장 출시 시간을 단축하는 방법. 코드 없는 솔루션으로 ML 모델을 만드는 방법에 대한 자세한 내용은 다음을 참조하세요. Amazon SageMaker Canvas 발표 - 비즈니스 분석가를 위한 시각적이고 코드가 없는 기계 학습 기능.


저자에 관하여

라자쿠마르 삼파스쿠마르 AWS의 수석 기술 계정 관리자로서 고객에게 비즈니스 기술 조정에 대한 지침을 제공하고 클라우드 운영 모델 및 프로세스의 재창조를 지원합니다. 그는 클라우드와 머신 러닝에 열정적입니다. Raj는 또한 기계 학습 전문가이며 AWS 고객과 협력하여 AWS 워크로드 및 아키텍처를 설계, 배포 및 관리합니다.

트완 앳킨스 Amazon Web Services의 수석 솔루션 아키텍트입니다. 그는 농업, 소매 및 제조 고객과 협력하여 비즈니스 문제를 식별하고 실행 가능하고 확장 가능한 기술 솔루션을 식별하기 위해 역방향 작업을 담당합니다. Twann은 최근 10년 이상 고객과 미래의 구축자를 위한 분석, 인공 지능 및 머신 러닝의 민주화에 중점을 두고 고객이 중요한 워크로드를 계획하고 마이그레이션할 수 있도록 지원해 왔습니다.

옴카르 무카담 Amazon Web Services의 Edge Specialist 솔루션 아키텍처입니다. 그는 현재 상용 고객이 AWS Snow Family를 포함하되 이에 국한되지 않는 AWS Edge 서비스를 통해 효과적으로 설계, 구축 및 확장할 수 있는 솔루션에 중점을 두고 있습니다.

spot_img

최신 인텔리전스

spot_img

우리와 함께 채팅

안녕하세요! 어떻게 도와 드릴까요?