Logo Zephyrnet

Thực hiện dự đoán gian lận hàng loạt với Amazon Fraud Detector mà không cần viết mã hoặc tích hợp API

Ngày:

Phát hiện gian lận Amazon là một dịch vụ được quản lý hoàn toàn giúp dễ dàng xác định các hoạt động trực tuyến có khả năng gian lận, chẳng hạn như tạo tài khoản giả hoặc gian lận thanh toán trực tuyến. Không giống như các gói machine learning (ML) đa năng, Amazon Fraud Detector được thiết kế đặc biệt để phát hiện gian lận. Amazon Fraud Detector kết hợp dữ liệu của bạn, khoa học ML mới nhất và hơn 20 năm kinh nghiệm phát hiện gian lận từ Amazon.com và AWS để xây dựng các mô hình ML được thiết kế riêng để phát hiện gian lận trong doanh nghiệp của bạn.

Sau khi bạn đào tạo một mô hình phát hiện gian lận được tùy chỉnh cho doanh nghiệp của mình, bạn tạo các quy tắc để diễn giải kết quả đầu ra của mô hình và tạo một công cụ phát hiện để chứa cả mô hình và quy tắc. Sau đó, bạn có thể đánh giá các hoạt động trực tuyến để phát hiện gian lận trong thời gian thực bằng cách gọi cho máy dò của bạn thông qua GetEventPrediction API và chuyển thông tin chi tiết về một sự kiện trong mỗi yêu cầu. Nhưng nếu bạn không có hỗ trợ kỹ thuật để tích hợp API hoặc bạn muốn đánh giá nhanh nhiều sự kiện cùng một lúc thì sao? Trước đây, bạn cần phải tạo giải pháp tùy chỉnh sử dụng AWS LambdaDịch vụ lưu trữ đơn giản của Amazon (Amazon S3). Điều này yêu cầu bạn phải viết và duy trì mã và nó chỉ có thể đánh giá tối đa 4,000 sự kiện cùng một lúc. Giờ đây, bạn có thể tạo dự đoán hàng loạt trong Amazon Fraud Detector để nhanh chóng và dễ dàng đánh giá một số lượng lớn các sự kiện để phát hiện gian lận.

Tổng quan về giải pháp

Để sử dụng tính năng dự đoán hàng loạt, bạn phải hoàn thành các bước cấp cao sau:

  1. Tạo và xuất bản một công cụ phát hiện có chứa các quy tắc và mô hình dự đoán gian lận của bạn hoặc đơn giản là một bộ quy tắc.
  2. Tạo bộ chứa S3 đầu vào để tải tệp của bạn lên và, tùy chọn, bộ chứa đầu ra để lưu trữ kết quả của bạn.
  3. Tạo tệp CSV chứa tất cả các sự kiện bạn muốn đánh giá.
  4. Thực hiện công việc dự đoán hàng loạt thông qua bảng điều khiển Amazon Fraud Detector.
  5. Xem lại kết quả của bạn trong tệp CSV được tạo và lưu trữ trên Amazon S3.

Tạo và xuất bản trình phát hiện

Bạn có thể tạo và xuất bản phiên bản trình phát hiện bằng bảng điều khiển Amazon Fraud Detector hoặc thông qua API. Để biết hướng dẫn về bảng điều khiển, hãy xem Bắt đầu (bảng điều khiển).

Tạo bộ chứa S3 đầu vào và đầu ra

Tạo bộ chứa S3 trên bảng điều khiển Amazon S3 nơi bạn tải tệp CSV lên. Đây là thùng đầu vào của bạn. Theo tùy chọn, bạn có thể tạo bộ chứa đầu ra thứ hai trong đó Amazon Fraud Detector lưu trữ kết quả dự đoán hàng loạt của bạn dưới dạng tệp CSV. Nếu bạn không chỉ định bộ chứa đầu ra, Amazon Fraud Detector sẽ lưu trữ cả tệp đầu vào và tệp đầu ra của bạn trong cùng một bộ chứa.

Đảm bảo rằng bạn tạo các nhóm của mình ở cùng Khu vực với trình phát hiện của bạn. Để biết thêm thông tin, xem Tạo một thùng.

Tạo một tệp CSV mẫu của các bản ghi sự kiện

Chuẩn bị tệp CSV chứa các sự kiện bạn muốn đánh giá. Trong tệp này, hãy bao gồm một cột cho từng biến trong loại sự kiện được liên kết với trình phát hiện của bạn. Ngoài ra, bao gồm các cột cho:

  • EVENT_ID – Mã định danh cho sự kiện, chẳng hạn như số giao dịch. Các giá trị của trường phải đáp ứng mẫu biểu thức chính quy sau: ^[0-9a-z_-]+$.
  • ID PHAP NHÂN – Mã định danh cho thực thể thực hiện sự kiện, chẳng hạn như số tài khoản. Các giá trị của trường cũng phải đáp ứng mẫu biểu thức chính quy sau: ^[0-9a-z_-]+$.
  • SỰ KIỆN_TIMESTAMP – Dấu thời gian, ở định dạng ISO 8601, khi sự kiện xảy ra.
  • ENTITY_TYPE – Thực thể thực hiện sự kiện, chẳng hạn như khách hàng hoặc người bán.

Tên tiêu đề cột phải khớp chính xác với tên biến Amazon Fraud Detector tương ứng. Bốn tên tiêu đề cột bắt buộc trước đó phải là chữ hoa và tên tiêu đề cột cho các biến được liên kết với loại sự kiện của bạn phải là chữ thường. Bạn nhận được lỗi cho bất kỳ sự kiện nào trong tệp có giá trị bị thiếu.

Trong tệp CSV của bạn, mỗi hàng tương ứng với một sự kiện mà bạn muốn tạo dự đoán. Tệp CSV có thể lên tới 50 MB, cho phép khoảng 50,000-100,000 sự kiện tùy thuộc vào quy mô sự kiện của bạn. Ảnh chụp màn hình sau đây hiển thị ví dụ về tệp CSV đầu vào.

Để biết thêm thông tin về các loại dữ liệu biến và định dạng của Amazon Fraud Detector, hãy xem Tạo một biến.

Thực hiện dự đoán hàng loạt

Tải tệp CSV của bạn lên nhóm đầu vào của bạn. Bây giờ là lúc bắt đầu công việc dự đoán hàng loạt.

  1. Trên bảng điều khiển Trình phát hiện gian lận của Amazon, hãy chọn Dự đoán hàng loạt trong khung điều hướng.

Trang này chứa một bản tóm tắt các công việc dự đoán hàng loạt trong quá khứ.

  1. Chọn Dự đoán lô mới.

  1. Trong Tên công việc¸ bạn có thể nhập tên cho công việc của mình hoặc để Amazon Fraud Detector gán một tên ngẫu nhiên.
  2. Trong Máy dòphiên bản máy dò, hãy chọn trình phát hiện và phiên bản bạn muốn sử dụng cho dự đoán hàng loạt của mình.
  3. Trong Vai trò IAM, nếu bạn đã có một Quản lý truy cập và nhận dạng AWS (IAM), bạn có thể chọn nó từ menu thả xuống. Ngoài ra, bạn có thể tạo một cái bằng cách chọn Tạo vai trò IAM.

Khi tạo một vai trò IAM mới, bạn có thể chỉ định các nhóm khác nhau cho các tệp đầu vào và đầu ra hoặc nhập cùng một tên nhóm cho cả hai.

Nếu bạn sử dụng một vai trò IAM hiện có, chẳng hạn như vai trò mà bạn sử dụng để truy cập bộ dữ liệu để đào tạo mô hình, thì bạn cần đảm bảo rằng vai trò đó có s3:PutObject quyền được đính kèm trước khi bắt đầu công việc dự đoán hàng loạt.

  1. Sau khi bạn chọn vai trò IAM của mình, đối với Vị trí dữ liệu, hãy nhập URI S3 cho tệp đầu vào của bạn.
  2. Chọn Bắt đầu.

Bạn đã trở lại Dự đoán hàng loạt trang, nơi bạn có thể xem công việc bạn vừa tạo. Thời gian xử lý công việc dự đoán hàng loạt khác nhau dựa trên số lượng sự kiện bạn đang đánh giá. Ví dụ: tệp 20 MB (khoảng 20,000 sự kiện) mất khoảng 12 phút. Bạn có thể xem trạng thái của công việc bất kỳ lúc nào trên bảng điều khiển Amazon Fraud Detector. Việc chọn tên công việc sẽ mở ra trang chi tiết công việc với thông tin bổ sung như vị trí dữ liệu đầu vào và đầu ra.

Xem lại kết quả dự đoán hàng loạt của bạn

Sau khi công việc hoàn tất, bạn có thể tải xuống tệp đầu ra của mình từ bộ chứa S3 mà bạn đã chỉ định. Để tìm tệp nhanh chóng, hãy chọn liên kết bên dưới Vị trí dữ liệu đầu ra trên trang chi tiết công việc.

Tệp đầu ra có tất cả các cột bạn đã cung cấp trong tệp đầu vào của mình, cùng với ba cột bổ sung:

  • TÌNH TRẠNG - Trình diễn Success nếu sự kiện được đánh giá thành công hoặc mã lỗi nếu sự kiện không thể được đánh giá
  • KẾT QUẢ – Biểu thị kết quả nào được trả về bởi bộ quy tắc của bạn
  • MODEL_SCORES – Biểu thị điểm rủi ro được trả về bởi bất kỳ mô hình nào được gọi bởi bộ quy tắc của bạn

Ảnh chụp màn hình sau đây hiển thị ví dụ về tệp CSV đầu ra.

Kết luận

Chúc mừng! Bạn đã thực hiện thành công một lô dự đoán gian lận. Bạn có thể sử dụng tính năng dự đoán hàng loạt để kiểm tra các thay đổi đối với logic phát hiện gian lận của mình, chẳng hạn như phiên bản mô hình mới hoặc các quy tắc được cập nhật. Bạn cũng có thể sử dụng dự đoán hàng loạt để thực hiện đánh giá gian lận không đồng bộ, chẳng hạn như kiểm tra hàng ngày tất cả các tài khoản được tạo trong 24 giờ qua.

Tùy thuộc vào trường hợp sử dụng của bạn, bạn có thể muốn sử dụng kết quả dự đoán của mình trong các dịch vụ AWS khác. Ví dụ: bạn có thể phân tích kết quả dự đoán trong Amazon QuickSight hoặc gửi kết quả có rủi ro cao đến AI tăng cường của Amazon (Amazon A2I) để xem xét dự đoán của con người. Bạn cũng có thể muốn sử dụng amazoncloudwatch để lên lịch dự đoán hàng loạt định kỳ.

Amazon Fraud Detector có bản dùng thử miễn phí 2 tháng bao gồm 30,000 dự đoán mỗi tháng. Sau đó, giá bắt đầu ở mức 0.005 USD cho mỗi dự đoán đối với các dự đoán chỉ dựa trên quy tắc và 0.03 USD đối với các dự đoán dựa trên ML. Để biết thêm thông tin, xem Giá của Amazon Fraud Detector. Để biết thêm thông tin về Amazon Fraud Detector, bao gồm liên kết đến các bài đăng blog bổ sung, sổ ghi chép mẫu, hướng dẫn sử dụng và tài liệu API, hãy xem Phát hiện gian lận Amazon.

Nếu bạn có bất kỳ câu hỏi hoặc nhận xét nào, hãy cho chúng tôi biết trong phần bình luận!


Lưu ý

song song Ali là Giám đốc sản phẩm cấp cao làm việc trên Amazon Fraud Detector. Anh ấy lắng nghe các vấn đề của khách hàng và tìm cách giúp họ chống lại gian lận và lạm dụng tốt hơn. Anh ấy dành thời gian rảnh để xem các tập phim Jeopardy cũ và tìm kiếm những chiếc bánh taco ngon nhất ở Austin, TX.

Coinsmart. Đặt cạnh Bitcoin-Börse ở Europa
Nguồn: https://aws.amazon.com/blogs/machine-learning/perform-batch-fraud-predictions-with-amazon-fraud-detector-without-writing-code-or-integrating-an-api/

tại chỗ_img

Tin tức mới nhất

tại chỗ_img