Amazon Fraud Detector에서 ML 모델과 비즈니스 정의 규칙을 사용하여 모기지 문서 사기 탐지 자동화: 3부

. 첫 번째 게시물 3부로 구성된 이 시리즈에서 우리는 모기지 인수 사용 사례에 대해 AWS AI 및 기계 학습(ML) 서비스를 사용하여 대규모 문서 변조 및 사기 탐지를 자동화할 수 있는 방법을 보여주는 솔루션을 제시했습니다.

. 두 번째 게시물에서는 모기지 인수 시 위조 이미지를 탐지하고 강조하기 위한 딥러닝 기반 컴퓨터 비전 모델을 개발하는 접근 방식에 대해 논의했습니다.

이 게시물에서는 ML 모델과 비즈니스 정의 규칙을 사용하여 모기지 문서 사기 탐지를 자동화하는 솔루션을 제시합니다. 아마존 사기 탐지기.

솔루션 개요

우리는 완전관리형 사기 탐지 서비스인 Amazon Fraud Detector를 사용하여 사기 활동 탐지를 자동화합니다. 문서 사기를 사전에 식별하여 사기 예측 정확도를 향상시키는 동시에 보험 인수 정확도를 향상한다는 목표를 가지고 Amazon Fraud Detector는 과거 데이터 세트를 사용하여 사용자 정의 사기 탐지 모델을 구축하고, 내장된 규칙 엔진을 사용하여 사용자 정의 결정 논리를 구성하고, 위험 결정을 조율하는 데 도움을 줍니다. 버튼 클릭만으로 워크플로우를 수행할 수 있습니다.

다음 다이어그램은 모기지 문서 사기 탐지 파이프라인의 각 단계를 나타냅니다.

개념적 아키텍처

이제 모기지 문서 사기 탐지 파이프라인의 세 번째 구성 요소를 다룰 것입니다. 이 구성 요소를 배포하는 단계는 다음과 같습니다.

과거 데이터 업로드 아마존 단순 스토리지 서비스 (아마존 S3).
옵션을 선택하고 모델을 학습시키세요.
모델을 만듭니다.
모델 성능을 검토합니다.
모델을 배포하십시오.
탐지기를 만듭니다.
모델 점수를 해석하는 규칙을 추가합니다.
예측을 위해 API를 배포합니다.

사전 조건

다음은 이 솔루션의 전제 조건 단계입니다.

AWS 계정에 가입합니다.
AWS 계정이 Amazon Fraud Detector에 액세스할 수 있도록 허용하는 권한을 설정하십시오.
다음 요구 사항에 따라 사기 탐지기 모델을 교육하는 데 사용할 과거 사기 데이터를 수집합니다.
1. 데이터는 CSV 형식이어야 하며 헤더가 있어야 합니다.
2. 두 개의 헤더가 필요합니다. EVENT_TIMESTAMP 과 EVENT_LABEL.
3. 데이터는 서비스에서 지원하는 AWS 리전의 Amazon S3에 있어야 합니다.
4. 훈련하기 전에 데이터 프로필을 실행하는 것이 좋습니다( Amazon Fraud Detector용 자동 데이터 프로파일러).
5. 최소 3~6개월의 데이터를 사용하는 것이 좋습니다.
6. 사기가 성숙해지기까지는 시간이 걸립니다. 1~3개월 된 데이터가 권장됩니다(너무 최근은 아님).
7. 일부 NULL 및 누락된 값은 허용됩니다. 그러나 너무 많으면 변수가 무시됩니다. 누락되거나 잘못된 변수 유형).

Amazon S3에 기록 데이터 업로드

사기 탐지기 모델을 교육하기 위한 사용자 지정 기록 데이터 파일이 있으면 S3 버킷을 생성하고 데이터를 버킷에 업로드합니다.

옵션 선택 및 모델 학습

사기 탐지기 모델을 구축하고 훈련하기 위한 다음 단계는 사기를 평가할 비즈니스 활동(이벤트)을 정의하는 것입니다. 이벤트를 정의하려면 데이터세트의 변수, 이벤트를 시작하는 엔터티, 이벤트를 분류하는 라벨을 설정해야 합니다.

새 모기지 신청을 참조하여 모기지 신청자에 의해 시작되는 문서 사기를 탐지하기 위해 문서 사기 이벤트를 정의하려면 다음 단계를 완료하십시오.

Amazon Fraud Detector 콘솔에서 이벤트 탐색 창에서
왼쪽 메뉴에서 만들기.
$XNUMX Million 미만 이벤트 유형 세부정보, 입력 docfraud 이벤트 유형 이름으로 선택하고, 선택적으로 이벤트에 대한 설명을 입력합니다.
왼쪽 메뉴에서 엔티티 생성.
에 엔티티 생성 페이지, 입력 applicant_mortgage 엔터티 유형 이름으로 입력하고 선택적으로 엔터티 유형에 대한 설명을 입력합니다.
왼쪽 메뉴에서 엔티티 생성.
$XNUMX Million 미만 이벤트 변수에 대한 이 이벤트의 변수를 정의하는 방법을 선택하십시오.선택한다. 훈련 데이터 세트에서 변수 선택.
럭셔리 IAM 역할선택한다. IAM 역할 생성.
에 IAM 역할 생성 페이지에서 예시 데이터와 함께 S3 버킷의 이름을 입력하고 선택합니다. 역할 만들기.
럭셔리 데이터 위치에서 기록 데이터의 경로를 입력하세요. 기록 데이터를 업로드한 후 저장한 S3 URI 경로입니다. 경로는 비슷해요 S3://your-bucket-name/example dataset filename.csv.
왼쪽 메뉴에서 가이드라가.

변수는 사기 예측에 사용하려는 데이터 요소를 나타냅니다. 이러한 변수는 모델 교육을 위해 준비한 이벤트 데이터 세트, Amazon Fraud Detector 모델의 위험 점수 출력 또는 다음에서 가져올 수 있습니다. 아마존 세이지 메이커 모델. 이벤트 데이터세트에서 가져온 변수에 대한 자세한 내용은 다음을 참조하세요. 데이터 모델 탐색기를 사용하여 이벤트 데이터 세트 요구 사항 가져오기.

$XNUMX Million 미만 라벨 – 선택사항에 대한 레이블선택한다. 새 라벨 만들기.
에 라벨 만들기 페이지, 입력 fraud 이름 그대로. 이 라벨은 예제 데이터세트의 사기성 모기지 신청을 나타내는 값에 해당합니다.
왼쪽 메뉴에서 라벨 만들기.
라는 두 번째 라벨을 만듭니다. legit. 이 라벨은 예제 데이터 세트에서 합법적인 모기지 신청을 나타내는 값에 해당합니다.
왼쪽 메뉴에서 이벤트 유형 생성.

다음 스크린샷은 이벤트 유형 세부정보를 보여줍니다.

이벤트 유형 세부정보

다음 스크린샷은 변수를 보여줍니다.

모델 변수

다음 스크린샷은 라벨을 보여줍니다.

레이블

모델 만들기

기록 데이터를 로드하고 모델 학습에 필요한 옵션을 선택한 후 다음 단계를 완료하여 모델을 만듭니다.

Amazon Fraud Detector 콘솔에서 모델 탐색 창에서
왼쪽 메뉴에서 모델 추가, 다음을 선택하십시오. 모델 생성.
에 모델 세부 정보 정의 페이지, 입력 mortgage_fraud_detection_model 모델 이름과 모델에 대한 선택적 설명입니다.
럭셔리 모델 유형을 선택하십시오 온라인 사기 인사이트 모델입니다.
럭셔리 이벤트 유형선택한다. docfraud. 이는 이전에 생성한 이벤트 유형입니다.
. 과거 이벤트 데이터 섹션에서 다음 정보를 제공하십시오.
1. 럭셔리 이벤트 데이터 소스선택한다. S3(또는 AFD)에 업로드되어 저장된 이벤트 데이터.
2. 럭셔리 IAM 역할에서 이전에 생성한 역할을 선택합니다.
3. 럭셔리 훈련 데이터 위치, 예제 데이터 파일의 S3 URI 경로를 입력합니다.
왼쪽 메뉴에서 다음 보기.
. 모델 입력 섹션에서 모든 확인란을 선택된 상태로 둡니다. 기본적으로 Amazon Fraud Detector는 기록 이벤트 데이터 세트의 모든 변수를 모델 입력으로 사용합니다.
. 라벨 분류 섹션 사기 라벨선택한다. fraud, 이는 예시 데이터세트의 사기 이벤트를 나타내는 값에 해당합니다.
럭셔리 합법적 인 레이블선택한다. legit, 이는 예시 데이터 세트에서 합법적인 이벤트를 나타내는 값에 해당합니다.
럭셔리 라벨이 지정되지 않은 이벤트, 기본 선택을 유지합니다 라벨이 지정되지 않은 이벤트 무시 이 예시 데이터세트의 경우.
왼쪽 메뉴에서 다음 보기.
설정을 검토한 다음 모델 생성 및 학습.

Amazon Fraud Detector는 모델을 생성하고 해당 모델의 새 버전 훈련을 시작합니다.

에 모델 버전 페이지 Status 열은 모델 학습 상태를 나타냅니다. 예시 데이터 세트를 사용하는 모델 학습을 완료하는 데 약 45분이 소요됩니다. 상태가 다음으로 변경됩니다. 배포 준비 모델 훈련이 완료된 후.

모델 성능 검토

모델 훈련이 완료되면 Amazon Fraud Detector는 모델 훈련에 사용되지 않은 데이터의 15%를 사용하여 모델 성능을 검증하고 점수 분포 차트, 혼동 행렬 등 다양한 도구를 제공하여 모델 성능을 평가합니다.

모델의 성능을 보려면 다음 단계를 완료하세요.

Amazon Fraud Detector 콘솔에서 모델 탐색 창에서
방금 훈련한 모델을 선택합니다(sample_fraud_detection_model)를 선택한 다음 1.0. 이는 Amazon Fraud Detector가 모델에 대해 생성한 버전입니다.
검토 모델 성능 이 모델에 대해 Amazon Fraud Detector가 생성한 전체 점수 및 기타 모든 지표입니다.

모델 성능

모델 배포

훈련된 모델의 성능 지표를 검토하고 이를 사용하여 사기 예측을 생성할 준비가 되면 모델을 배포할 수 있습니다.

Amazon Fraud Detector 콘솔에서 모델 탐색 창에서
모델 선택 sample_fraud_detection_model를 클릭한 다음 배포하려는 특정 모델 버전을 선택합니다. 이 게시물의 경우 다음을 선택하세요. 1.0.
에 모델 버전 페이지에서 행위 메뉴, 선택 모델 버전 배포.

에 모델 버전 페이지 Status 배포 상태를 보여줍니다. 상태가 다음으로 변경됩니다. 최근활동 배포가 완료되면. 이는 모델 버전이 활성화되어 사기 예측을 생성하는 데 사용할 수 있음을 나타냅니다.

감지기 만들기

모델을 배포한 후 다음을 위한 감지기를 구축합니다. docfraud 이벤트 유형을 선택하고 배포된 모델을 추가합니다. 다음 단계를 완료하세요.

Amazon Fraud Detector 콘솔에서 검출기 탐색 창에서
왼쪽 메뉴에서 감지기 만들기.
에 감지기 세부정보 정의 페이지, 입력 fraud_detector 탐지기 이름에 대해 선택적으로 내 샘플 사기 탐지기와 같은 탐지기에 대한 설명을 입력합니다.
럭셔리 이벤트 종류선택한다. docfraud. 이는 이전에 생성한 이벤트입니다.
왼쪽 메뉴에서 다음 보기.

해석할 규칙 추가

Amazon Fraud Detector 모델을 생성한 후 Amazon Fraud Detector 콘솔 또는 API(애플리케이션 프로그래밍 인터페이스)를 사용하여 비즈니스 중심 규칙(사기 예측을 평가할 때 Amazon Fraud Detector에 모델 성능 점수를 해석하는 방법을 알려주는 조건)을 정의할 수 있습니다. . 모기지 인수 프로세스에 맞춰 사기, 적법성 또는 검토가 필요한지 여부와 관련된 위험 수준에 따라 모기지 신청에 플래그를 지정하는 규칙을 생성할 수 있습니다.

예를 들어, 필수 문서의 변조된 이미지, 급여명세서 또는 소득 요건과 같은 누락된 문서 등과 같은 매개변수를 고려하여 사기 위험이 높은 모기지 신청을 자동으로 거부할 수 있습니다. 반면에 특정 애플리케이션에는 효과적인 결정을 내리기 위해 사람이 개입해야 할 수도 있습니다.

Amazon Fraud Detector는 집계된 값(원시 변수 세트를 결합하여 계산됨)과 원시 값(변수에 제공된 값)을 사용하여 모델 점수를 생성합니다. 모델 점수는 0~1000 사이일 수 있습니다. 여기서 0은 사기 위험이 낮음을 나타내고 1000은 사기 위험이 높음을 나타냅니다.

각 비즈니스 중심 규칙을 추가하려면 다음 단계를 완료하세요.

Amazon Fraud Detector 콘솔에서 규칙 탐색 창에서
왼쪽 메뉴에서 규칙 추가.
. 규칙 정의 섹션에서 규칙 이름으로 Fraud를 입력하고 선택적으로 설명을 입력합니다.
럭셔리 표현, Amazon Fraud Detector의 단순화된 규칙 표현 언어를 사용하여 규칙 표현식을 입력합니다. $docdraud_insightscore >= 900
럭셔리 결과선택한다. 새로운 결과 만들기 (결과는 사기 예측의 결과이며 평가 중에 규칙이 일치하면 반환됩니다.)
. 새로운 결과 만들기 섹션에서 결과 이름으로 거절을 입력하고 선택적 설명을 입력합니다.
왼쪽 메뉴에서 결과 저장
왼쪽 메뉴에서 규칙 추가 규칙 유효성 검사기를 실행하고 규칙을 저장합니다.
생성된 후 Amazon Fraud Detector는 다음을 수행합니다. high_risk 탐지기에서 사용할 수 있는 규칙입니다.
1. 규칙 이름 : fraud
2. 결과: decline
3. 식 : $docdraud_insightscore >= 900
왼쪽 메뉴에서 다른 규칙 추가를 선택한 다음 규칙 만들기 탭을 클릭하면 아래와 같이 2개의 규칙을 추가할 수 있습니다.
만들기 low_risk 다음 세부정보가 포함된 규칙:
1. 규칙 이름 : legit
2. 결과: approve
3. 식 : $docdraud_insightscore <= 500
만들기 medium_risk 다음 세부정보가 포함된 규칙:
1. 규칙 이름 : review needed
2. 결과: review
3. 식 : $docdraud_insightscore <= 900 and docdraud_insightscore >=500

이 값은 이 게시물에 사용된 예입니다. 자체 감지기에 대한 규칙을 생성할 때 모델 및 사용 사례에 적합한 값을 사용하세요.

세 가지 규칙을 모두 생성한 후 다음을 선택합니다. 다음 보기.

예측을 위해 API 배포

규칙 기반 작업이 트리거된 후 Amazon Fraud Detector API를 배포하여 대출 애플리케이션을 평가하고 잠재적인 사기를 예측할 수 있습니다. 예측은 일괄적으로 또는 실시간으로 수행될 수 있습니다.

Amazon Fraud Detector API 배포

SageMaker 모델 통합(선택 사항)

SageMaker에 사기 탐지 모델이 이미 있는 경우 이를 Amazon Fraud Detector와 통합하여 원하는 결과를 얻을 수 있습니다.

이는 애플리케이션에서 SageMaker 및 Amazon Fraud Detector 모델을 모두 사용하여 다양한 유형의 사기를 탐지할 수 있음을 의미합니다. 예를 들어 애플리케이션은 Amazon Fraud Detector 모델을 사용하여 고객 계정의 사기 위험을 평가하는 동시에 PageMaker 모델을 사용하여 계정 손상 위험을 확인할 수 있습니다.

정리

향후 요금이 발생하지 않도록 하려면 다음을 포함하여 솔루션용으로 생성된 리소스를 삭제하세요.

S3 버킷
Amazon Fraud Detector 엔드포인트

결론

이 게시물에서는 모기지 인수 과정에서 사기를 탐지하기 위한 자동화된 맞춤형 솔루션을 안내했습니다. 이 솔루션을 사용하면 사기 발생 시점에 가까운 사기 시도를 감지하고 보험업자가 효과적인 의사 결정 프로세스를 수행할 수 있도록 돕습니다. 또한 구현의 유연성을 통해 비즈니스 중심 규칙을 정의하여 특정 비즈니스 요구 사항에 맞게 맞춤화된 사기 시도를 분류하고 포착할 수 있습니다.

엔드 투 엔드 모기지 문서 사기 탐지 솔루션 구축에 대한 자세한 내용은 다음을 참조하세요. 파트 1 과 파트 2 이 시리즈에서.

저자 소개

아눕 라빈드라나트 캐나다 토론토에 본사를 둔 AWS(Amazon Web Services)의 선임 솔루션 설계자로 금융 서비스 조직과 협력하고 있습니다. 그는 고객이 비즈니스를 혁신하고 클라우드에서 혁신하도록 돕습니다.

비니 사이니 캐나다 토론토에 본사를 둔 Amazon Web Services(AWS)의 선임 솔루션 아키텍트입니다. 그녀는 Architectural Excellence의 강력한 기본 기둥에 놓인 AI 및 ML 기반 솔루션을 통해 금융 서비스 고객이 클라우드에서 혁신하도록 돕고 있습니다.

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
출처: https://aws.amazon.com/blogs/machine-learning/automate-mortgage-document-fraud-detection-using-an-ml-model-and-business-defined-rules-with-amazon-fraud-detector-part-3/

생성 데이터 인텔리전스

Amazon Fraud Detector의 ML 모델과 비즈니스 정의 규칙을 사용하여 모기지 문서 사기 탐지 자동화: 3부 | 아마존 웹 서비스

솔루션 개요

사전 조건

Amazon S3에 기록 데이터 업로드

옵션 선택 및 모델 학습

모델 만들기

모델 성능 검토

모델 배포

감지기 만들기

해석할 규칙 추가

예측을 위해 API 배포

SageMaker 모델 통합(선택 사항)

정리

결론

저자 소개

BDAG는 5년 상위 2024개 유망 암호화폐 사전 판매를 주도합니다.

암호화폐를 구매하기 전에 시장 감정을 평가하는 방법

최신 인텔리전스

SOL 네트워크 문제 및 DOT 가격 예측 중 BlockDAG의 100억 달러 유동성 및 베스팅 기간

Rainbet 및 Crypto 카지노: 팩의 리더

Forbes는 20개의 암호화폐 '좀비'를 공개하고 Ripple과 XRP가 언데드에 속한다고 선언했습니다.

전문가의 과감한 요청: 이제 달러를 비트코인으로 교환할 시간입니다

비트코인 대학살: 암호화폐 분석가, 8% 가격 하락 후 '데스 크로스' 발견

AIEMP, 혁신적인 AI 보안 프로젝트 출시 발표