Logo Zephyrnet

Tự động phát hiện gian lận tài liệu thế chấp bằng mô hình ML và các quy tắc do doanh nghiệp xác định với Amazon Fraud Detector: Phần 3 | Dịch vụ web của Amazon

Ngày:

Trong tạp chí bài viết đầu tiên Trong loạt bài gồm ba phần này, chúng tôi đã trình bày một giải pháp minh họa cách bạn có thể tự động phát hiện hành vi giả mạo và gian lận tài liệu trên quy mô lớn bằng cách sử dụng dịch vụ AWS AI và machine learning (ML) cho trường hợp sử dụng bảo lãnh thế chấp.

Trong tạp chí bài đăng thứ hai, chúng tôi đã thảo luận về cách tiếp cận để phát triển mô hình thị giác máy tính dựa trên deep learning nhằm phát hiện và làm nổi bật các hình ảnh giả mạo trong bảo lãnh thế chấp.

Trong bài đăng này, chúng tôi trình bày một giải pháp tự động phát hiện gian lận tài liệu thế chấp bằng mô hình ML và các quy tắc do doanh nghiệp xác định với Phát hiện gian lận Amazon.

Tổng quan về giải pháp

Chúng tôi sử dụng Amazon Fraud Detector, một dịch vụ phát hiện gian lận được quản lý toàn phần, để tự động hóa việc phát hiện các hoạt động gian lận. Với mục tiêu cải thiện độ chính xác trong dự đoán gian lận bằng cách chủ động xác định gian lận tài liệu, đồng thời cải thiện độ chính xác bảo lãnh, Amazon Fraud Detector giúp bạn xây dựng các mô hình phát hiện gian lận tùy chỉnh bằng cách sử dụng tập dữ liệu lịch sử, đặt cấu hình logic quyết định tùy chỉnh bằng công cụ quy tắc tích hợp và điều phối quyết định rủi ro quy trình công việc chỉ bằng một nút bấm.

Sơ đồ sau đây thể hiện từng giai đoạn trong quy trình phát hiện gian lận tài liệu thế chấp.

Kiến trúc khái niệm

Bây giờ chúng tôi sẽ đề cập đến thành phần thứ ba của quy trình phát hiện gian lận tài liệu thế chấp. Các bước triển khai thành phần này như sau:

  1. Tải dữ liệu lịch sử lên Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3).
  2. Chọn các tùy chọn của bạn và đào tạo mô hình.
  3. Tạo mô hình.
  4. Đánh giá hiệu quả của mô hình.
  5. Triển khai mô hình.
  6. Tạo một máy dò.
  7. Thêm quy tắc để giải thích điểm mô hình.
  8. Triển khai API để đưa ra dự đoán.

Điều kiện tiên quyết

Sau đây là các bước tiên quyết cho giải pháp này:

  1. Đăng ký tài khoản AWS.
  2. Thiết lập quyền cho phép tài khoản AWS của bạn truy cập Amazon Fraud Detector.
  3. Thu thập dữ liệu gian lận lịch sử để sử dụng cho việc huấn luyện mô hình phát hiện gian lận với các yêu cầu sau:
    1. Dữ liệu phải ở định dạng CSV và có tiêu đề.
    2. Cần có hai tiêu đề: EVENT_TIMESTAMPEVENT_LABEL.
    3. Dữ liệu phải nằm trong Amazon S3 ở Khu vực AWS được dịch vụ hỗ trợ.
    4. Bạn nên chạy hồ sơ dữ liệu trước khi huấn luyện (sử dụng trình phân tích dữ liệu tự động dành cho Amazon Fraud Detector).
    5. Bạn nên sử dụng ít nhất 3–6 tháng dữ liệu.
    6. Cần có thời gian để gian lận trưởng thành; Nên sử dụng dữ liệu cách đây 1–3 tháng (không quá gần đây).
    7. Một số giá trị NULL và giá trị bị thiếu có thể chấp nhận được (nhưng quá nhiều thì biến sẽ bị bỏ qua, như đã thảo luận trong phần Loại biến bị thiếu hoặc không chính xác).

Tải dữ liệu lịch sử lên Amazon S3

Sau khi bạn có các tệp dữ liệu lịch sử tùy chỉnh để huấn luyện mô hình phát hiện gian lận, hãy tạo bộ chứa S3 và tải dữ liệu lên bộ chứa.

Chọn các tùy chọn và huấn luyện mô hình

Bước tiếp theo hướng tới việc xây dựng và đào tạo mô hình phát hiện gian lận là xác định hoạt động kinh doanh (sự kiện) để đánh giá hành vi gian lận. Việc xác định một sự kiện bao gồm việc đặt các biến trong tập dữ liệu của bạn, một thực thể khởi tạo sự kiện và các nhãn phân loại sự kiện.

Hoàn thành các bước sau để xác định một sự kiện gian lận tài liệu nhằm phát hiện gian lận tài liệu, được khởi xướng bởi tổ chức thế chấp của người nộp đơn, đề cập đến đơn đăng ký thế chấp mới:

  1. Trên bảng điều khiển Trình phát hiện gian lận của Amazon, hãy chọn Sự Kiện trong khung điều hướng.
  2. Chọn Tạo.
  3. Theo Chi tiết loại sự kiện, đi vào docfraud làm tên loại sự kiện và, tùy ý, nhập mô tả về sự kiện.
  4. Chọn Tạo thực thể.
  5. trên Tạo thực thể trang, nhập applicant_mortgage làm tên loại thực thể và, tùy ý, nhập mô tả về loại thực thể đó.
  6. Chọn Tạo thực thể.
  7. Theo biến sự kiện, Cho Chọn cách xác định các biến của sự kiện này, chọn Chọn các biến từ tập dữ liệu đào tạo.
  8. Trong Vai trò IAM, chọn Tạo vai trò IAM.
  9. trên Tạo vai trò IAM trang, hãy nhập tên của nhóm S3 với dữ liệu mẫu của bạn và chọn Tạo vai trò.
  10. Trong Vị trí dữ liệu, hãy nhập đường dẫn đến dữ liệu lịch sử của bạn. Đây là đường dẫn URI S3 mà bạn đã lưu sau khi tải dữ liệu lịch sử lên. Đường dẫn tương tự như S3://your-bucket-name/example dataset filename.csv.
  11. Chọn Tải lên.

Các biến đại diện cho các thành phần dữ liệu mà bạn muốn sử dụng để dự đoán gian lận. Các biến này có thể được lấy từ tập dữ liệu sự kiện mà bạn đã chuẩn bị để huấn luyện mô hình của mình, từ kết quả điểm rủi ro của mô hình Amazon Fraud Detector hoặc từ Amazon SageMaker các mô hình. Để biết thêm thông tin về các biến được lấy từ tập dữ liệu sự kiện, hãy xem Nhận các yêu cầu về tập dữ liệu sự kiện bằng cách sử dụng Trình khám phá mô hình dữ liệu.

  1. Theo Nhãn - tùy chọn, Cho Nhãn, chọn Tạo nhãn mới.
  2. trên Tạo nhãn trang, nhập fraud như một cái tên. Nhãn này tương ứng với giá trị đại diện cho đơn đăng ký thế chấp gian lận trong tập dữ liệu mẫu.
  3. Chọn Tạo nhãn.
  4. Tạo nhãn thứ hai gọi là legit. Nhãn này tương ứng với giá trị đại diện cho đơn đăng ký thế chấp hợp pháp trong tập dữ liệu mẫu.
  5. Chọn Tạo loại sự kiện.

Ảnh chụp màn hình sau đây hiển thị chi tiết loại sự kiện của chúng tôi.

Chi tiết loại sự kiện

Ảnh chụp màn hình sau đây hiển thị các biến của chúng tôi.

Biến mô hình

Ảnh chụp màn hình sau đây hiển thị nhãn của chúng tôi.

Nhãn

Tạo mô hình

Sau khi bạn đã tải dữ liệu lịch sử và chọn các tùy chọn cần thiết để huấn luyện mô hình, hãy hoàn thành các bước sau để tạo mô hình:

  1. Trên bảng điều khiển Trình phát hiện gian lận của Amazon, hãy chọn mô hình trong khung điều hướng.
  2. Chọn Thêm mô hình, và sau đó chọn Tạo mô hình.
  3. trên Xác định chi tiết mô hình trang, nhập mortgage_fraud_detection_model làm tên của mô hình và mô tả tùy chọn của mô hình.
  4. Trong Loại mô hình, chọn Thông tin chuyên sâu về gian lận trực tuyến mô hình.
  5. Trong Loại sự kiện, chọn docfraud. Đây là loại sự kiện mà bạn đã tạo trước đó.
  6. Trong tạp chí Dữ liệu sự kiện lịch sử , cung cấp thông tin sau:
    1. Trong Nguồn dữ liệu sự kiện, chọn Dữ liệu sự kiện được lưu trữ được tải lên S3 (hoặc AFD).
    2. Trong Vai trò IAM, hãy chọn vai trò mà bạn đã tạo trước đó.
    3. Trong Vị trí dữ liệu đào tạo, hãy nhập đường dẫn URI S3 vào tệp dữ liệu mẫu của bạn.
  7. Chọn Sau.
  8. Trong tạp chí Đầu vào mô hình phần này, hãy chọn tất cả các hộp kiểm. Theo mặc định, Amazon Fraud Detector sử dụng tất cả các biến từ tập dữ liệu sự kiện lịch sử của bạn làm đầu vào mô hình.
  9. Trong tạp chí phân loại nhãn phần, cho Nhãn gian lận, chọn fraud, tương ứng với giá trị đại diện cho các sự kiện gian lận trong tập dữ liệu mẫu.
  10. Trong Nhãn hợp pháp, chọn legit, tương ứng với giá trị đại diện cho các sự kiện hợp lệ trong tập dữ liệu mẫu.
  11. Trong Sự kiện không được gắn nhãn, giữ nguyên lựa chọn mặc định Bỏ qua các sự kiện chưa được gắn nhãn cho tập dữ liệu ví dụ này.
  12. Chọn Sau.
  13. Xem lại cài đặt của bạn, sau đó chọn Tạo và đào tạo mô hình.

Amazon Fraud Detector tạo một mô hình và bắt đầu huấn luyện phiên bản mới của mô hình đó.

trên Phiên bản mô hình trang, Trạng thái cột cho biết trạng thái đào tạo mô hình. Quá trình đào tạo mô hình sử dụng tập dữ liệu mẫu mất khoảng 45 phút để hoàn thành. Trạng thái thay đổi thành Sẵn sàng triển khai sau khi đào tạo mô hình hoàn tất.

Đánh giá hiệu suất mô hình

Sau khi quá trình đào tạo mô hình hoàn tất, Amazon Fraud Detector xác thực hiệu suất mô hình bằng cách sử dụng 15% dữ liệu không được sử dụng để huấn luyện mô hình và cung cấp nhiều công cụ khác nhau, bao gồm biểu đồ phân bổ điểm số và ma trận nhầm lẫn, để đánh giá hiệu suất mô hình.

Để xem hiệu suất của mô hình, hãy hoàn thành các bước sau:

  1. Trên bảng điều khiển Trình phát hiện gian lận của Amazon, hãy chọn mô hình trong khung điều hướng.
  2. Chọn mô hình mà bạn vừa đào tạo (sample_fraud_detection_model), tiếp đó hãy chọn 1.0. Đây là phiên bản Amazon Fraud Detector được tạo cho mô hình của bạn.
  3. Xem lại Hiệu suất mô hình điểm tổng thể và tất cả số liệu khác mà Amazon Fraud Detector đã tạo cho mô hình này.

Hiệu suất mô hình

Triển khai mô hình

Sau khi bạn đã xem xét các số liệu hiệu suất của mô hình được đào tạo của mình và sẵn sàng sử dụng nó để tạo ra các dự đoán gian lận, bạn có thể triển khai mô hình:

  1. Trên bảng điều khiển Trình phát hiện gian lận của Amazon, hãy chọn mô hình trong khung điều hướng.
  2. Chọn mô hình sample_fraud_detection_model, sau đó chọn phiên bản mô hình cụ thể mà bạn muốn triển khai. Đối với bài viết này, chọn 1.0.
  3. trên Phiên bản mô hình trang, trên Hoạt động menu, chọn Triển khai phiên bản mô hình.

trên Phiên bản mô hình trang, Trạng thái hiển thị trạng thái triển khai. Trạng thái thay đổi thành hoạt động khi việc triển khai hoàn tất. Điều này cho thấy rằng phiên bản mô hình đã được kích hoạt và có sẵn để tạo ra các dự đoán gian lận.

Tạo một máy dò

Sau khi bạn đã triển khai mô hình, bạn xây dựng một bộ dò tìm cho docfraud loại sự kiện và thêm mô hình đã triển khai. Hoàn thành các bước sau:

  1. Trên bảng điều khiển Trình phát hiện gian lận của Amazon, hãy chọn Máy dò trong khung điều hướng.
  2. Chọn Tạo máy dò.
  3. trên Xác định chi tiết máy dò trang, nhập fraud_detector cho tên trình phát hiện và, tùy ý, nhập mô tả cho trình phát hiện, chẳng hạn như trình phát hiện gian lận mẫu của tôi.
  4. Trong Loại sự kiện, chọn docfraud. Đây là sự kiện mà bạn đã tạo trước đó.
  5. Chọn Sau.

Thêm quy tắc để giải thích

Sau khi tạo mô hình Amazon Fraud Detector, bạn có thể sử dụng bảng điều khiển Amazon Fraud Detector hoặc giao diện lập trình ứng dụng (API) để xác định các quy tắc hướng đến hoạt động kinh doanh (các điều kiện cho Amazon Fraud Detector biết cách diễn giải điểm hiệu suất của mô hình khi đánh giá dự đoán gian lận) . Để phù hợp với quy trình bảo lãnh thế chấp, bạn có thể tạo các quy tắc để gắn cờ các đơn đăng ký thế chấp theo mức độ rủi ro liên quan và được xác định là gian lận, hợp pháp hoặc nếu cần xem xét.

Ví dụ: bạn có thể muốn tự động từ chối các đơn đăng ký thế chấp có rủi ro gian lận cao, xem xét các tham số như hình ảnh giả mạo của các tài liệu được yêu cầu, các tài liệu bị thiếu như cuống phiếu lương hoặc yêu cầu về thu nhập, v.v. Mặt khác, một số ứng dụng nhất định có thể cần con người tham gia để đưa ra quyết định hiệu quả.

Amazon Fraud Detector sử dụng giá trị tổng hợp (được tính bằng cách kết hợp một tập hợp các biến thô) và giá trị thô (giá trị được cung cấp cho biến) để tạo ra điểm số mô hình. Điểm mô hình có thể nằm trong khoảng từ 0–1000, trong đó 0 biểu thị rủi ro gian lận thấp và 1000 biểu thị rủi ro gian lận cao.

Để thêm các quy tắc định hướng kinh doanh tương ứng, hãy hoàn thành các bước sau:

  1. Trên bảng điều khiển Trình phát hiện gian lận của Amazon, hãy chọn Nội quy trong khung điều hướng.
  2. Chọn Thêm quy tắc.
  3. Trong tạp chí Xác định một quy tắc phần, nhập gian lận cho tên quy tắc và, tùy ý, nhập mô tả.
  4. Trong Biểu hiện, nhập biểu thức quy tắc bằng ngôn ngữ biểu thức quy tắc đơn giản hóa của Amazon Fraud Detector $docdraud_insightscore >= 900
  5. Trong Kết quả, chọn Tạo một kết quả mới (Kết quả là kết quả từ một dự đoán gian lận và được trả về nếu quy tắc phù hợp trong quá trình đánh giá.)
  6. Trong tạp chí Tạo một kết quả mới phần, nhập từ chối làm tên kết quả và mô tả tùy chọn.
  7. Chọn Lưu kết quả
  8. Chọn Thêm quy tắc để chạy trình kiểm tra xác thực quy tắc và lưu quy tắc.
  9. Sau khi được tạo, Amazon Fraud Detector sẽ thực hiện như sau high_risk quy tắc có sẵn để sử dụng trong máy dò của bạn.
    1. Tên quy tắc: fraud
    2. Kết quả: decline
    3. Biểu hiện: $docdraud_insightscore >= 900
  10. Chọn Thêm một quy tắc khác, và sau đó chọn Tạo quy tắc tab để thêm 2 quy tắc bổ sung như sau:
  11. Tạo ra một low_risk quy định với các chi tiết sau:
    1. Tên quy tắc: legit
    2. Kết quả: approve
    3. Biểu hiện: $docdraud_insightscore <= 500
  12. Tạo ra một medium_risk quy định với các chi tiết sau:
    1. Tên quy tắc: review needed
    2. Kết quả: review
    3. Biểu hiện: $docdraud_insightscore <= 900 and docdraud_insightscore >=500

Những giá trị này là những ví dụ được sử dụng cho bài viết này. Khi bạn tạo quy tắc cho trình phát hiện của riêng mình, hãy sử dụng các giá trị phù hợp với mô hình và trường hợp sử dụng của bạn.

  1. Sau khi bạn đã tạo cả ba quy tắc, hãy chọn Sau.

Các quy tắc liên quan

Triển khai API để đưa ra dự đoán

Sau khi kích hoạt các hành động dựa trên quy tắc, bạn có thể triển khai API Amazon Fraud Detector để đánh giá các ứng dụng cho vay và dự đoán hành vi gian lận tiềm ẩn. Các dự đoán có thể được thực hiện theo đợt hoặc theo thời gian thực.

Triển khai API phát hiện gian lận của Amazon

Tích hợp mô hình SageMaker của bạn (Tùy chọn)

Nếu đã có mô hình phát hiện gian lận trong SageMaker, bạn có thể tích hợp mô hình đó với Amazon Fraud Detector để có kết quả mong muốn.

Điều này ngụ ý rằng bạn có thể sử dụng cả hai mô hình SageMaker và Amazon Fraud Detector trong ứng dụng của mình để phát hiện các loại gian lận khác nhau. Ví dụ: ứng dụng của bạn có thể sử dụng mô hình Amazon Fraud Detector để đánh giá rủi ro gian lận đối với tài khoản khách hàng, đồng thời sử dụng mô hình PageMaker để kiểm tra rủi ro xâm phạm tài khoản.

Làm sạch

Để tránh phát sinh bất kỳ khoản phí nào trong tương lai, hãy xóa các tài nguyên đã tạo cho giải pháp, bao gồm các tài nguyên sau:

  • Xô S3
  • Điểm cuối của Trình phát hiện gian lận của Amazon

Kết luận

Bài đăng này hướng dẫn bạn một giải pháp tự động và tùy chỉnh để phát hiện gian lận trong quy trình bảo lãnh thế chấp. Giải pháp này cho phép bạn phát hiện các nỗ lực gian lận gần hơn với thời điểm xảy ra gian lận và giúp các nhà bảo lãnh có quy trình ra quyết định hiệu quả. Ngoài ra, tính linh hoạt của việc triển khai cho phép bạn xác định các quy tắc hướng đến hoạt động kinh doanh để phân loại và nắm bắt các nỗ lực gian lận được tùy chỉnh theo nhu cầu kinh doanh cụ thể.

Để biết thêm thông tin về việc xây dựng giải pháp phát hiện gian lận tài liệu thế chấp toàn diện, hãy tham khảo Phần 1Phần 2 trong loạt bài này.


Giới thiệu về tác giả


Anup Ravindranath
là Kiến trúc sư giải pháp cấp cao tại Amazon Web Services (AWS) có trụ sở tại Toronto, Canada làm việc với các tổ chức Dịch vụ tài chính. Anh ấy giúp khách hàng chuyển đổi doanh nghiệp của họ và đổi mới trên đám mây.

Vinnie Saini là Kiến trúc sư giải pháp cấp cao tại Amazon Web Services (AWS) có trụ sở tại Toronto, Canada. Cô ấy đã và đang giúp các khách hàng của Dịch vụ tài chính chuyển đổi trên đám mây, với các giải pháp dựa trên AI và ML được đặt trên các trụ cột nền tảng vững chắc của Kiến trúc xuất sắc.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img