제퍼넷 로고

Amazon SageMaker Canvas를 사용하면 코드 한 줄도 작성하지 않고 기계 학습을 사용할 수 있습니다. 아마존 웹 서비스

시간

최근에는 기계 학습(ML)을 사용하여 특히 텍스트와 이미지 형식의 데이터에 대해 예측을 수행하려면 딥 러닝 모델을 생성하고 조정하기 위한 광범위한 ML 지식이 필요했습니다. 오늘날 ML 모델을 사용하여 비즈니스 가치를 창출하려는 모든 사용자는 ML에 더 쉽게 접근할 수 있게 되었습니다. 와 함께 Amazon SageMaker 캔버스를 사용하면 단 한 줄의 코드도 작성하지 않고도 표 형식 데이터나 시계열 데이터를 넘어 다양한 데이터 유형에 대한 예측을 생성할 수 있습니다. 이러한 기능에는 이미지, 텍스트 및 문서 데이터 유형에 대한 사전 학습된 모델이 포함됩니다.

이 게시물에서는 사전 훈련된 모델을 사용하여 표 형식 데이터 외에 지원되는 데이터 유형에 대한 예측을 검색하는 방법에 대해 설명합니다.

텍스트 데이터

SageMaker Canvas는 ML 모델 구축, 교육 및 배포를 위한 시각적인 노코드 환경을 제공합니다. 자연어 처리(NLP) 작업의 경우 SageMaker Canvas는 다음과 원활하게 통합됩니다. 아마존 이해 언어 감지, 엔터티 인식, 감정 분석, 주제 모델링 등과 같은 주요 NLP 기능을 수행할 수 있습니다. 통합을 통해 Amazon Comprehend의 강력한 NLP 모델을 사용하기 위해 코딩이나 데이터 엔지니어링이 필요하지 않습니다. 텍스트 데이터를 제공하고 일반적으로 사용되는 XNUMX가지 기능(감정 분석, 언어 감지, 엔터티 추출, 개인 정보 감지) 중에서 선택하기만 하면 됩니다. 각 시나리오에 대해 UI를 사용하여 일괄 예측을 테스트하고 사용하여 저장된 데이터를 선택할 수 있습니다. 아마존 단순 스토리지 서비스 (아마존 S3).

SageMaker Canvas에서 텍스트 데이터 분석

감정 분석

감정 분석을 통해 SageMaker Canvas를 사용하면 입력 텍스트의 감정을 분석할 수 있습니다. 다음 스크린샷에 표시된 것처럼 전반적인 정서가 긍정적, 부정적, 혼합 또는 중립인지 확인할 수 있습니다. 이는 제품 리뷰 분석과 같은 상황에서 유용합니다. 예를 들어, "I love this product, it is amazing!"이라는 텍스트가 있습니다. SageMaker Canvas에서는 긍정적인 감정으로 분류되는 반면, "이 제품은 끔찍합니다. 구매한 것이 후회됩니다"는 부정적인 감정으로 분류됩니다.

SageMaker 캔버스의 감정 분석

엔터티 추출

SageMaker Canvas는 텍스트를 분석하고 그 안에 언급된 엔터티를 자동으로 감지할 수 있습니다. 분석을 위해 문서가 SageMaker Canvas로 전송되면 텍스트의 사람, 조직, 위치, 날짜, 수량 및 기타 개체를 식별합니다. 이 엔터티 추출 기능을 사용하면 문서에서 논의된 주요 인물, 장소 및 세부 정보에 대한 통찰력을 빠르게 얻을 수 있습니다. 지원되는 엔터티 목록은 다음을 참조하세요. 엔터티.

SageMaker 캔버스에서 개체 추출

언어 감지

SageMaker Canvas는 Amazon Comprehend를 사용하여 텍스트의 주요 언어를 결정할 수도 있습니다. 텍스트를 분석하여 기본 언어를 식별하고 감지된 주요 언어에 대한 신뢰도 점수를 제공하지만 다국어 문서에 대한 분석 비율은 표시하지 않습니다. 여러 언어로 된 긴 문서에서 최상의 결과를 얻으려면 텍스트를 작은 조각으로 분할하고 결과를 집계하여 언어 비율을 추정하세요. 최소 20자 이상의 텍스트에서 가장 잘 작동합니다.

SageMaker 캔버스의 언어 감지

개인정보 탐지

SageMaker Canvas의 개인 정보 탐지를 사용하여 민감한 데이터를 보호할 수도 있습니다. 텍스트 문서를 분석하여 개인 식별 정보(PII) 항목을 자동으로 감지하여 이름, 주소, 생년월일, 전화번호, 이메일 주소 등과 같은 민감한 데이터를 찾을 수 있습니다. 최대 100KB의 문서를 분석하고 감지된 각 엔터티에 대한 신뢰도 점수를 제공하므로 가장 민감한 정보를 검토하고 선택적으로 수정할 수 있습니다. 감지된 엔터티 목록은 다음을 참조하세요. PII 엔터티 감지.

SageMaker 캔버스에서 PII 감지

이미지 데이터

SageMaker Canvas는 다음과 통합하여 컴퓨터 비전 기능을 쉽게 사용할 수 있는 시각적, 코드 없는 인터페이스를 제공합니다. 아마존 인식 이미지 분석을 위해 예를 들어, 이미지 데이터 세트를 업로드하고, Amazon Rekognition을 사용하여 객체와 장면을 감지하고, 텍스트 감지를 수행하여 광범위한 사용 사례를 해결할 수 있습니다. 시각적 인터페이스와 Amazon Rekognition 통합을 통해 개발자가 아닌 사람도 고급 컴퓨터 비전 기술을 활용할 수 있습니다.

SageMaker Canvas에서 이미지 데이터 분석

이미지의 객체 감지

SageMaker Canvas는 Amazon Rekognition을 사용하여 이미지에서 레이블(객체)을 감지합니다. SageMaker Canvas UI에서 이미지를 업로드하거나 배치 예측 탭을 클릭하여 S3 버킷에 저장된 이미지를 선택하세요. 다음 예시와 같이 시계탑, 버스, 건물 등 영상 속 객체를 추출할 수 있습니다. 인터페이스를 사용하여 예측 결과를 검색하고 정렬할 수 있습니다.

SageMaker 캔버스의 이미지에서 객체 감지

이미지의 텍스트 감지

이미지에서 텍스트를 추출하는 것은 매우 일반적인 사용 사례입니다. 이제 코드 없이 SageMaker Canvas에서 이 작업을 쉽게 수행할 수 있습니다. 다음 스크린샷에 표시된 것처럼 텍스트가 품목으로 추출됩니다. 이미지 내 짧은 문구를 함께 분류하여 문구로 식별합니다.

SageMaker 캔버스의 이미지에서 텍스트 감지

이미지 세트를 업로드하여 일괄 예측을 수행하고, 단일 일괄 작업으로 모든 이미지를 추출하고, 결과를 CSV 파일로 다운로드할 수 있습니다. 이 솔루션은 이미지에서 텍스트를 추출하고 감지하려는 경우에 유용합니다.

문서 데이터

SageMaker Canvas는 일상적인 문서 이해 요구 사항을 해결하는 즉시 사용 가능한 다양한 솔루션을 제공합니다. 이러한 솔루션은 다음을 통해 구동됩니다. 아마존 텍사스. 문서에 사용 가능한 모든 옵션을 보려면 다음을 선택하세요. 즉시 사용 가능한 모델 탐색 창에서 다음을 기준으로 필터링합니다. 서류다음 스크린 샷에 표시된대로

SageMaker Canvas에서 문서 데이터 분석

문서분석

문서 분석은 감지된 텍스트 간의 관계에 대해 문서와 양식을 분석합니다. 이 작업은 원시 텍스트, 양식, 테이블 및 서명이라는 네 가지 문서 추출 범주를 반환합니다. 문서 구조를 이해하는 솔루션의 기능은 문서에서 추출하려는 데이터 유형에 추가적인 유연성을 제공합니다. 다음 스크린샷은 테이블 감지 모양의 예입니다.

SageMaker 캔버스의 문서 분석

이 솔루션은 복잡한 문서의 레이아웃을 이해할 수 있어 문서에서 특정 정보를 추출해야 할 때 유용합니다.

신원 문서 분석

이 솔루션은 개인 신분증, 운전면허증 또는 기타 유사한 신분증과 같은 문서를 분석하도록 설계되었습니다. 다음 스크린샷에 표시된 것처럼 중간 이름, 카운티, 출생지 등의 정보와 정확성에 대한 개별 신뢰도 점수가 각 신원 문서에 대해 반환됩니다.

SageMaker Canvas의 신원 문서 분석

일괄 예측을 수행하는 옵션이 있습니다. 이를 통해 신원 확인 문서 세트를 대량으로 업로드하고 일괄 작업으로 처리할 수 있습니다. 이는 식별 문서 세부 정보를 데이터 분석과 같은 다운스트림 프로세스에 사용할 수 있는 키-값 쌍으로 변환하는 빠르고 원활한 방법을 제공합니다.

비용 분석

비용 분석은 송장, 영수증과 같은 비용 문서를 분석하도록 설계되었습니다. 다음 스크린샷은 추출된 정보가 어떻게 표시되는지 보여주는 예입니다.

SageMaker 캔버스의 비용 분석

결과는 요약 필드 및 품목 필드로 반환됩니다. 요약 필드는 문서에서 추출된 키-값 쌍이며 다음과 같은 키를 포함합니다. 총 합계, 마감일부가세. 품목 필드는 문서에서 테이블로 구성된 데이터를 나타냅니다. 이는 레이아웃을 유지하면서 문서에서 정보를 추출하는 데 유용합니다.

문서 쿼리

문서 쿼리는 문서에 대해 질문할 수 있도록 설계되었습니다. 이는 여러 페이지로 구성된 문서가 있고 문서에서 매우 구체적인 답변을 추출하려는 경우 사용할 수 있는 훌륭한 솔루션입니다. 다음은 질문할 수 있는 질문 유형과 추출된 답변의 모양에 대한 예입니다.

SageMaker 캔버스의 문서 쿼리

이 솔루션은 문서와 상호 작용할 수 있는 간단한 인터페이스를 제공합니다. 이는 큰 문서 내에서 특정 세부 정보를 얻고 싶을 때 유용합니다.

결론

SageMaker Canvas는 텍스트, 이미지, 문서 등 다양한 데이터 유형에서 ML을 쉽게 사용할 수 있는 코드 없는 환경을 제공합니다. Amazon Comprehend, Amazon Rekognition 및 Amazon Textract와 같은 AWS 서비스와의 시각적 인터페이스 및 통합으로 코딩 및 데이터 엔지니어링이 필요하지 않습니다. 감정, 엔터티, 언어 및 PII에 대한 텍스트를 분석할 수 있습니다. 이미지의 경우 객체 및 텍스트 감지를 통해 컴퓨터 비전 사용 사례가 가능합니다. 마지막으로 문서 분석에서는 다운스트림 프로세스를 위해 레이아웃을 유지하면서 텍스트를 추출할 수 있습니다. SageMaker Canvas의 즉시 사용 가능한 솔루션을 사용하면 고급 ML 기술을 활용하여 구조화된 데이터와 구조화되지 않은 데이터 모두에서 통찰력을 얻을 수 있습니다. 바로 사용할 수 있는 ML 모델과 함께 코드 없는 도구를 사용하는 데 관심이 있다면 지금 SageMaker Canvas를 사용해 보십시오. 자세한 내용은 다음을 참조하세요. Amazon SageMaker Canvas 사용 시작하기.


저자 소개

줄리아 앙 싱가포르에 본사를 둔 솔루션 아키텍트입니다. 그녀는 의료 및 공공 부문부터 디지털 기반 비즈니스에 이르기까지 다양한 분야의 고객과 협력하여 비즈니스 요구 사항에 따라 솔루션을 채택했습니다. 그녀는 또한 동남아시아 및 기타 지역의 고객이 비즈니스에 AI 및 ML을 사용할 수 있도록 지원해 왔습니다. 직장 밖에서 그녀는 여행을 통해 세상에 대해 배우고 창의적인 활동에 참여하는 것을 즐깁니다.

로케 준카이 싱가포르에 본사를 둔 AI/ML 전문 솔루션 아키텍트입니다. 그는 ASEAN 전역의 고객과 협력하여 AWS에서 대규모 기계 학습 솔루션을 설계합니다. Jun Kai는 Low-Code No-Code 기계 학습 도구를 옹호합니다. 여가 시간에는 자연과 함께 있는 것을 즐깁니다.

spot_img

최신 인텔리전스

spot_img