Logo Zéphyrnet

Automatisez la détection de la fraude relative aux documents hypothécaires à l'aide d'un modèle ML et de règles définies par l'entreprise avec Amazon Fraud Detector : Partie 3 | Services Web Amazon

Date :

Dans le premier message Dans cette série en trois parties, nous avons présenté une solution qui démontre comment automatiser la détection de la falsification de documents et de la fraude à grande échelle à l'aide de l'IA AWS et des services d'apprentissage automatique (ML) pour un cas d'utilisation de souscription hypothécaire.

Dans le deuxième message, nous avons discuté d'une approche visant à développer un modèle de vision par ordinateur basé sur l'apprentissage profond pour détecter et mettre en évidence les images falsifiées lors de la souscription de prêts hypothécaires.

Dans cet article, nous présentons une solution pour automatiser la détection de fraude dans les documents hypothécaires à l'aide d'un modèle ML et de règles définies par l'entreprise avec Détecteur de fraude Amazon.

Vue d'ensemble de la solution

Nous utilisons Amazon Fraud Detector, un service de détection des fraudes entièrement géré, pour automatiser la détection des activités frauduleuses. Dans le but d'améliorer la précision des prévisions de fraude en identifiant de manière proactive la fraude documentaire, tout en améliorant la précision de la souscription, Amazon Fraud Detector vous aide à créer des modèles de détection de fraude personnalisés à l'aide d'un ensemble de données historiques, à configurer une logique de décision personnalisée à l'aide du moteur de règles intégré et à orchestrer les décisions en matière de risques. flux de travail en un seul clic.

Le diagramme suivant représente chaque étape d’un pipeline de détection de fraude liée aux documents hypothécaires.

Architecture conceptuelle

Nous allons maintenant aborder le troisième élément du pipeline de détection des fraudes liées aux documents hypothécaires. Les étapes pour déployer ce composant sont les suivantes :

  1. Téléchargez les données historiques vers Service de stockage simple Amazon (Amazon S3).
  2. Sélectionnez vos options et entraînez le modèle.
  3. Créez le modèle.
  4. Examinez les performances du modèle.
  5. Déployez le modèle.
  6. Créez un détecteur.
  7. Ajoutez des règles pour interpréter les scores du modèle.
  8. Déployez l'API pour faire des prédictions.

Pré-requis

Voici les étapes préalables à cette solution :

  1. Ouvrez un compte AWS.
  2. Configurez des autorisations qui permettent à votre compte AWS d'accéder à Amazon Fraud Detector.
  3. Collectez les données historiques sur la fraude à utiliser pour entraîner le modèle de détecteur de fraude, avec les exigences suivantes :
    1. Les données doivent être au format CSV et comporter des en-têtes.
    2. Deux en-têtes sont requis : EVENT_TIMESTAMP ainsi que EVENT_LABEL.
    3. Les données doivent résider dans Amazon S3 dans une région AWS prise en charge par le service.
    4. Il est fortement recommandé d'exécuter un profil de données avant de vous entraîner (utilisez un profileur de données automatisé pour Amazon Fraud Detector).
    5. Il est recommandé d'utiliser au moins 3 à 6 mois de données.
    6. Il faut du temps pour que la fraude mûrisse ; des données datant de 1 à 3 mois sont recommandées (pas trop récentes).
    7. Certaines valeurs NULL et valeurs manquantes sont acceptables (mais si elles sont trop nombreuses, la variable est ignorée, comme indiqué dans Type de variable manquant ou incorrect).

Télécharger des données historiques sur Amazon S3

Une fois que vous disposez des fichiers de données historiques personnalisés pour former un modèle de détecteur de fraude, créez un compartiment S3 et téléchargez les données dans le compartiment.

Sélectionnez les options et entraînez le modèle

La prochaine étape vers la création et la formation d'un modèle de détecteur de fraude consiste à définir l'activité commerciale (événement) à évaluer pour la fraude. Définir un événement implique de définir les variables de votre ensemble de données, une entité initiant l'événement et les étiquettes qui classent l'événement.

Suivez les étapes suivantes pour définir un événement de fraude documentaire afin de détecter une fraude documentaire initiée par l'entité candidate au prêt hypothécaire, faisant référence à une nouvelle demande de prêt hypothécaire :

  1. Sur la console Amazon Fraud Detector, choisissez Événements dans le volet de navigation.
  2. Selectionnez Création.
  3. Sous Détails du type d'événement, Entrer docfraud comme nom du type d'événement et, éventuellement, entrez une description de l'événement.
  4. Selectionnez Créer une entité.
  5. Sur le Créer une entité page, entrez applicant_mortgage comme nom du type d'entité et, éventuellement, entrez une description du type d'entité.
  6. Selectionnez Créer une entité.
  7. Sous Variables d'événement, Pour Choisissez comment définir les variables de cet événement, choisissez Sélectionnez des variables dans un ensemble de données d'entraînement.
  8. Pour Rôle IAM, choisissez Créer un rôle IAM.
  9. Sur le Créer un rôle IAM page, entrez le nom du compartiment S3 avec vos exemples de données et choisissez Créer un rôle.
  10. Pour Emplacement des données, saisissez le chemin d'accès à vos données historiques. Il s'agit du chemin URI S3 que vous avez enregistré après le téléchargement des données historiques. Le chemin est similaire à S3://your-bucket-name/example dataset filename.csv.
  11. Selectionnez Téléchargement.

Les variables représentent les éléments de données que vous souhaitez utiliser dans une prédiction de fraude. Ces variables peuvent être extraites de l'ensemble de données d'événement que vous avez préparé pour entraîner votre modèle, des sorties du score de risque de votre modèle Amazon Fraud Detector ou de Amazon Sage Maker des modèles. Pour plus d'informations sur les variables extraites de l'ensemble de données d'événement, consultez Obtenir les exigences relatives aux ensembles de données d'événements à l'aide de l'explorateur de modèles de données.

  1. Sous Étiquettes – facultatives, Pour Etiquettes, choisissez Créer de nouvelles étiquettes.
  2. Sur le Créer une étiquette page, entrez fraud comme nom. Cette étiquette correspond à la valeur qui représente la demande de prêt hypothécaire frauduleuse dans l'exemple de jeu de données.
  3. Selectionnez Créer une étiquette.
  4. Créez une deuxième étiquette appelée legit. Cette étiquette correspond à la valeur qui représente la demande de prêt hypothécaire légitime dans l'exemple d'ensemble de données.
  5. Selectionnez Créer un type d'événement.

La capture d'écran suivante montre les détails de notre type d'événement.

Détails du type d'événement

La capture d'écran suivante montre nos variables.

Variables du modèle

La capture d'écran suivante montre nos étiquettes.

Etiquettes

Créer le modèle

Après avoir chargé les données historiques et sélectionné les options requises pour entraîner un modèle, procédez comme suit pour créer un modèle :

  1. Sur la console Amazon Fraud Detector, choisissez Des modèles photo dans le volet de navigation.
  2. Selectionnez Ajouter un modèle, puis choisissez Créer un modèle.
  3. Sur le Définir les détails du modèle page, entrez mortgage_fraud_detection_model comme nom du modèle et une description facultative du modèle.
  4. Pour Type de modèle, choisir la Informations sur la fraude en ligne .
  5. Pour Type d'événement, choisissez docfraud. Il s'agit du type d'événement que vous avez créé précédemment.
  6. Dans le Données d'événements historiques rubrique, fournissez les informations suivantes :
    1. Pour Source de données d'événement, choisissez Données d'événement stockées téléchargées sur S3 (ou AFD).
    2. Pour Rôle IAM, choisissez le rôle que vous avez créé précédemment.
    3. Pour Emplacement des données d'entraînement, entrez le chemin URI S3 vers votre exemple de fichier de données.
  7. Selectionnez Suivant.
  8. Dans le Entrées du modèle section, laissez toutes les cases cochées. Par défaut, Amazon Fraud Detector utilise toutes les variables de votre ensemble de données d'événements historiques comme entrées de modèle.
  9. Dans le Classement des étiquettes section, pour Étiquettes de fraude, choisissez fraud, qui correspond à la valeur qui représente les événements frauduleux dans l'exemple d'ensemble de données.
  10. Pour Étiquettes légitimes, choisissez legit, qui correspond à la valeur qui représente les événements légitimes dans l'exemple d'ensemble de données.
  11. Pour Événements sans étiquette, conservez la sélection par défaut Ignorer les événements sans étiquette pour cet exemple d'ensemble de données.
  12. Selectionnez Suivant.
  13. Vérifiez vos paramètres, puis choisissez Créer et former un modèle.

Amazon Fraud Detector crée un modèle et commence à former une nouvelle version du modèle.

Sur le Versions des modèles page, la Statut La colonne indique l’état de la formation du modèle. La formation du modèle qui utilise l’exemple d’ensemble de données prend environ 45 minutes. Le statut passe à Prêt à déployer une fois la formation du modèle terminée.

Examiner les performances du modèle

Une fois la formation du modèle terminée, Amazon Fraud Detector valide les performances du modèle en utilisant 15 % de vos données qui n'ont pas été utilisées pour former le modèle et fournit divers outils, notamment un tableau de distribution des scores et une matrice de confusion, pour évaluer les performances du modèle.

Pour afficher les performances du modèle, procédez comme suit :

  1. Sur la console Amazon Fraud Detector, choisissez Des modèles photo dans le volet de navigation.
  2. Choisissez le modèle que vous venez d'entraîner (sample_fraud_detection_model), Alors choisi 1.0. Il s'agit de la version créée par Amazon Fraud Detector à partir de votre modèle.
  3. Revoir le Performances du modèle score global et toutes les autres mesures générées par Amazon Fraud Detector pour ce modèle.

Performances du modèle

Déployer le modèle

Une fois que vous avez examiné les mesures de performances de votre modèle entraîné et que vous êtes prêt à l'utiliser pour générer des prédictions de fraude, vous pouvez déployer le modèle :

  1. Sur la console Amazon Fraud Detector, choisissez Des modèles photo dans le volet de navigation.
  2. Choisissez le modèle sample_fraud_detection_model, puis choisissez la version de modèle spécifique que vous souhaitez déployer. Pour cet article, choisissez 1.0.
  3. Sur le Version du modèle sur la page Actions menu, choisissez Déployer la version du modèle.

Sur le Versions des modèles page, la Statut affiche l’état du déploiement. Le statut passe à Actif lorsque le déploiement sera terminé. Cela indique que la version du modèle est activée et disponible pour générer des prédictions de fraude.

Créer un détecteur

Après avoir déployé le modèle, vous construisez un détecteur pour le docfraud type d’événement et ajoutez le modèle déployé. Effectuez les étapes suivantes :

  1. Sur la console Amazon Fraud Detector, choisissez Détecteurs dans le volet de navigation.
  2. Selectionnez Créer un détecteur.
  3. Sur le Définir les détails du détecteur page, entrez fraud_detector pour le nom du détecteur et, éventuellement, entrez une description du détecteur, telle que mon échantillon de détecteur de fraude.
  4. Pour Type d'événement, choisissez docfraud. Il s'agit de l'événement que vous avez créé précédemment.
  5. Selectionnez Suivant.

Ajouter des règles à interpréter

Après avoir créé le modèle Amazon Fraud Detector, vous pouvez utiliser la console Amazon Fraud Detector ou l'interface de programmation d'application (API) pour définir des règles métier (conditions qui indiquent à Amazon Fraud Detector comment interpréter le score de performance du modèle lors de l'évaluation de la prédiction de fraude). . Pour vous aligner sur le processus de souscription hypothécaire, vous pouvez créer des règles pour signaler les demandes de prêt hypothécaire en fonction des niveaux de risque associés et identifiés comme frauduleux, légitimes ou si un examen est nécessaire.

Par exemple, vous souhaiterez peut-être refuser automatiquement les demandes de prêt hypothécaire présentant un risque de fraude élevé, en tenant compte de paramètres tels que des images falsifiées des documents requis, des documents manquants comme des fiches de paie ou des exigences de revenu, etc. D’un autre côté, certaines applications peuvent nécessiter la participation d’un humain pour prendre des décisions efficaces.

Amazon Fraud Detector utilise la valeur agrégée (calculée en combinant un ensemble de variables brutes) et la valeur brute (la valeur fournie pour la variable) pour générer les scores du modèle. Les scores du modèle peuvent être compris entre 0 et 1000 0, où 1000 indique un faible risque de fraude et XNUMX XNUMX indique un risque de fraude élevé.

Pour ajouter les règles métier respectives, procédez comme suit :

  1. Sur la console Amazon Fraud Detector, choisissez Règles dans le volet de navigation.
  2. Selectionnez Ajouter une règle.
  3. Dans le Définir une règle , saisissez fraud pour le nom de la règle et, éventuellement, saisissez une description.
  4. Pour Expression, saisissez l'expression de règle à l'aide du langage d'expression de règle simplifié d'Amazon Fraud Detector. $docdraud_insightscore >= 900
  5. Pour Résultats, choisissez Créer un nouveau résultat (Un résultat est le résultat d'une prédiction de fraude et est renvoyé si la règle correspond lors d'une évaluation.)
  6. Dans le Créer un nouveau résultat , entrez le refus comme nom du résultat et une description facultative.
  7. Selectionnez Enregistrer le résultat
  8. Selectionnez Ajouter une règle pour exécuter le vérificateur de validation de règle et enregistrer la règle.
  9. Une fois créé, Amazon Fraud Detector effectue les opérations suivantes : high_risk règle disponible pour une utilisation dans votre détecteur.
    1. Nom de la règle : fraud
    2. Résultat: decline
    3. Expression: $docdraud_insightscore >= 900
  10. Selectionnez Ajouter une autre règle, puis choisissez le Créer une règle onglet pour ajouter 2 règles supplémentaires comme ci-dessous :
  11. Créer un low_risk règle avec les détails suivants :
    1. Nom de la règle : legit
    2. Résultat: approve
    3. Expression: $docdraud_insightscore <= 500
  12. Créer un medium_risk règle avec les détails suivants :
    1. Nom de la règle : review needed
    2. Résultat: review
    3. Expression: $docdraud_insightscore <= 900 and docdraud_insightscore >=500

Ces valeurs sont des exemples utilisés pour cet article. Lorsque vous créez des règles pour votre propre détecteur, utilisez des valeurs appropriées à votre modèle et à votre cas d'utilisation.

  1. Après avoir créé les trois règles, choisissez Suivant.

Règles associées

Déployer l'API pour faire des prédictions

Une fois les actions basées sur des règles déclenchées, vous pouvez déployer une API Amazon Fraud Detector pour évaluer les demandes de prêt et prédire les fraudes potentielles. Les prédictions peuvent être effectuées par lots ou en temps réel.

Déployer l'API du détecteur de fraude Amazon

Intégrez votre modèle SageMaker (Facultatif)

Si vous disposez déjà d'un modèle de détection de fraude dans SageMaker, vous pouvez l'intégrer à Amazon Fraud Detector pour obtenir vos résultats préférés.

Cela implique que vous pouvez utiliser les modèles SageMaker et Amazon Fraud Detector dans votre application pour détecter différents types de fraude. Par exemple, votre application peut utiliser le modèle Amazon Fraud Detector pour évaluer le risque de fraude des comptes clients, et simultanément utiliser votre modèle PageMaker pour vérifier le risque de compromission des comptes.

Nettoyer

Pour éviter de devoir payer des frais futurs, supprimez les ressources créées pour la solution, notamment les suivantes :

  • Seau S3
  • Point de terminaison du détecteur de fraude Amazon

Conclusion

Cet article vous a présenté une solution automatisée et personnalisée pour détecter la fraude dans le processus de souscription hypothécaire. Cette solution vous permet de détecter les tentatives frauduleuses plus près du moment où la fraude survient et aide les souscripteurs à prendre des décisions efficaces. De plus, la flexibilité de la mise en œuvre vous permet de définir des règles métier pour classer et capturer les tentatives frauduleuses adaptées aux besoins spécifiques de l'entreprise.

Pour plus d'informations sur la création d'une solution de détection de fraude de documents hypothécaires de bout en bout, reportez-vous à Partie 1 ainsi que Partie 2 dans cette série.


À propos des auteurs


Anup Ravindranath
est un architecte de solutions senior chez Amazon Web Services (AWS) basé à Toronto, au Canada, travaillant avec des organisations de services financiers. Il aide les clients à transformer leurs entreprises et à innover sur le cloud.

Vinnie Saini est architecte de solutions senior chez Amazon Web Services (AWS) basé à Toronto, Canada. Elle a aidé les clients des services financiers à se transformer sur le cloud, avec des solutions basées sur l'IA et le ML reposant sur de solides piliers fondamentaux de l'excellence architecturale.

spot_img

Dernières informations

spot_img