Zephyrnet-logo

Automatiseer de detectie van hypotheekdocumentfraude met behulp van een ML-model en door het bedrijf gedefinieerde regels met Amazon Fraud Detector: Deel 3 | Amazon-webservices

Datum:

In het eerste bericht van deze driedelige serie presenteerden we een oplossing die laat zien hoe u het op grote schaal detecteren van geknoeid met documenten en fraude kunt automatiseren met behulp van AWS AI en machine learning (ML)-services voor een gebruiksscenario voor het afsluiten van hypotheken.

In het tweede berichtbespraken we een aanpak om een ​​op deep learning gebaseerd computer vision-model te ontwikkelen om vervalste afbeeldingen bij het afsluiten van hypotheken te detecteren en onder de aandacht te brengen.

In dit bericht presenteren we een oplossing om de detectie van hypotheekdocumentfraude te automatiseren met behulp van een ML-model en door de business gedefinieerde regels Amazone fraude detector.

Overzicht oplossingen

We gebruiken Amazon Fraud Detector, een volledig beheerde fraudedetectieservice, om de detectie van frauduleuze activiteiten te automatiseren. Met als doel de nauwkeurigheid van fraudevoorspellingen te verbeteren door proactief documentfraude te identificeren en tegelijkertijd de nauwkeurigheid van de acceptatie te verbeteren, helpt Amazon Fraud Detector u bij het bouwen van aangepaste modellen voor fraudedetectie met behulp van een historische dataset, het configureren van aangepaste beslissingslogica met behulp van de ingebouwde regelengine en het orkestreren van risicobeslissingen. workflows met één klik op de knop.

Het volgende diagram vertegenwoordigt elke fase in een pijplijn voor fraudedetectie met hypotheekdocumenten.

Conceptuele architectuur

We behandelen nu het derde onderdeel van de pijplijn voor het opsporen van fraude met hypotheekdocumenten. De stappen om dit onderdeel te implementeren zijn als volgt:

  1. Upload historische gegevens naar Amazon eenvoudige opslagservice (Amazone S3).
  2. Selecteer uw opties en train het model.
  3. Maak het model.
  4. Beoordeel de prestaties van het model.
  5. Implementeer het model.
  6. Maak een detector.
  7. Voeg regels toe om modelscores te interpreteren.
  8. Implementeer de API om voorspellingen te doen.

Voorwaarden

Hieronder volgen de vereiste stappen voor deze oplossing:

  1. Meld u aan voor een AWS-account.
  2. Stel machtigingen in waarmee uw AWS-account toegang krijgt tot Amazon Fraud Detector.
  3. Verzamel de historische fraudegegevens die moeten worden gebruikt om het fraudedetectormodel te trainen, met de volgende vereisten:
    1. Gegevens moeten de CSV-indeling hebben en headers bevatten.
    2. Er zijn twee headers vereist: EVENT_TIMESTAMP en EVENT_LABEL.
    3. Gegevens moeten zich in Amazon S3 bevinden in een AWS-regio die door de service wordt ondersteund.
    4. Het wordt ten zeerste aanbevolen om een ​​gegevensprofiel uit te voeren voordat u gaat trainen (gebruik een geautomatiseerde gegevensprofiler voor Amazon Fraud Detector).
    5. Het wordt aanbevolen om minimaal drie tot zes maanden aan gegevens te gebruiken.
    6. Het kost tijd voordat fraude volwassen wordt; gegevens van 1 tot 3 maanden oud worden aanbevolen (niet te recent).
    7. Sommige NULL's en ontbrekende waarden zijn acceptabel (maar te veel en de variabele wordt genegeerd, zoals besproken in Ontbrekend of onjuist type variabele).

Upload historische gegevens naar Amazon S3

Nadat u over de aangepaste historische gegevensbestanden beschikt om een ​​fraudedetectormodel te trainen, maakt u een S3-bucket en uploadt u de gegevens naar de bucket.

Selecteer opties en train het model

De volgende stap in de richting van het bouwen en trainen van een fraudedetectiemodel is het definiëren van de bedrijfsactiviteit (gebeurtenis) die moet worden geëvalueerd op de fraude. Het definiëren van een gebeurtenis omvat het instellen van de variabelen in uw gegevensset, een entiteit die de gebeurtenis initieert en de labels die de gebeurtenis classificeren.

Voer de volgende stappen uit om een ​​docfraud-gebeurtenis te definiëren om documentfraude op te sporen, die wordt geïnitieerd door de entiteit die de hypotheek aanvraagt ​​en verwijst naar een nieuwe hypotheekaanvraag:

  1. Kies op de Amazon Fraud Detector-console Evenementen in het navigatievenster.
  2. Kies creëren.
  3. Onder Details van het gebeurtenistype, ga naar binnen docfraud als de naam van het gebeurtenistype en voer optioneel een beschrijving van de gebeurtenis in.
  4. Kies Entiteit maken.
  5. Op de Entiteit maken pagina, voer in applicant_mortgage als de naam van het entiteitstype en voer optioneel een beschrijving van het entiteitstype in.
  6. Kies Entiteit maken.
  7. Onder Gebeurtenisvariabelenvoor Kies hoe u de variabelen van deze gebeurtenis wilt definiëren, kiezen Selecteer variabelen uit een trainingsgegevensset.
  8. Voor IAM-rol, kiezen Maak een IAM-rol.
  9. Op de Maak een IAM-rol pagina, voer de naam van de S3-bucket in met uw voorbeeldgegevens en kies Rol creëren.
  10. Voor Gegevenslocatie, voer het pad naar uw historische gegevens in. Dit is het S3-URI-pad dat u heeft opgeslagen na het uploaden van de historische gegevens. Het pad is vergelijkbaar met S3://your-bucket-name/example dataset filename.csv.
  11. Kies Uploaden.

Variabelen vertegenwoordigen gegevenselementen die u wilt gebruiken in een fraudevoorspelling. Deze variabelen kunnen worden gehaald uit de gebeurtenisgegevensset die u hebt voorbereid voor het trainen van uw model, uit de risicoscore-uitvoer van uw Amazon Fraud Detector-model, of uit Amazon Sage Maker modellen. Zie voor meer informatie over variabelen uit de gebeurtenisgegevensset Haal de vereisten voor gebeurtenisgegevenssets op met behulp van de gegevensmodellenverkenner.

  1. Onder Etiketten – optioneelvoor labels, kiezen Maak nieuwe etiketten.
  2. Op de Maak een label pagina, voer in fraud als de naam. Dit label komt overeen met de waarde die de frauduleuze hypotheekaanvraag in de voorbeelddataset vertegenwoordigt.
  3. Kies Maak een label.
  4. Maak een tweede label genaamd legit. Dit label komt overeen met de waarde die de legitieme hypotheekaanvraag in de voorbeelddataset vertegenwoordigt.
  5. Kies Maak een evenementtype aan.

De volgende schermafbeelding toont de details van ons evenementtype.

Details van het gebeurtenistype

De volgende schermafbeelding toont onze variabelen.

Modelvariabelen

De volgende schermafbeelding toont onze labels.

labels

Maak het model

Nadat u de historische gegevens hebt geladen en de vereiste opties hebt geselecteerd om een ​​model te trainen, voert u de volgende stappen uit om een ​​model te maken:

  1. Kies op de Amazon Fraud Detector-console Modellen in het navigatievenster.
  2. Kies Model toevoegenen kies vervolgens Maak een model.
  3. Op de Definieer modeldetails pagina, voer in mortgage_fraud_detection_model zoals de naam van het model en een optionele beschrijving van het model.
  4. Voor Model type, kies de Online fraude-inzichten model.
  5. Voor Type evenement, kiezen docfraud. Dit is het gebeurtenistype dat u eerder hebt gemaakt.
  6. In het Historische gebeurtenisgegevens sectie, geeft u de volgende informatie op:
    1. Voor Gegevensbron voor gebeurtenissen, kiezen Gebeurtenisgegevens opgeslagen, geüpload naar S3 (of AFD).
    2. Voor IAM-rol, kies de rol die u eerder hebt gemaakt.
    3. Voor Locatie van trainingsgegevensVoer het S3-URI-pad naar uw voorbeeldgegevensbestand in.
  7. Kies Volgende.
  8. In het Model ingangen sectie, laat alle selectievakjes aangevinkt. Standaard gebruikt Amazon Fraud Detector alle variabelen uit uw gegevensset met historische gebeurtenissen als modelinvoer.
  9. In het Etiket classificatie sectie, voor Fraude-etiketten, kiezen fraud, wat overeenkomt met de waarde die frauduleuze gebeurtenissen in de voorbeeldgegevensset vertegenwoordigt.
  10. Voor Legitieme labels, kiezen legit, wat overeenkomt met de waarde die legitieme gebeurtenissen in de voorbeeldgegevensset vertegenwoordigt.
  11. Voor Niet-gelabelde evenementen, behoud de standaardselectie Negeer niet-gelabelde gebeurtenissen voor deze voorbeeldgegevensset.
  12. Kies Volgende.
  13. Controleer uw instellingen en kies vervolgens Model maken en trainen.

Amazon Fraud Detector maakt een model en begint een nieuwe versie van het model te trainen.

Op de Modelversies pagina, de Status kolom geeft de status van modeltraining aan. Het duurt ongeveer 45 minuten om de modeltraining waarbij de voorbeeldgegevensset wordt gebruikt, te voltooien. De status verandert in Klaar om te implementeren nadat de modeltraining is voltooid.

Beoordeel de prestaties van het model

Nadat de modeltraining is voltooid, valideert Amazon Fraud Detector de modelprestaties met behulp van 15% van uw gegevens die niet zijn gebruikt om het model te trainen en biedt het verschillende hulpmiddelen, waaronder een scoreverdelingsdiagram en een verwarringsmatrix, om de modelprestaties te beoordelen.

Voer de volgende stappen uit om de prestaties van het model te bekijken:

  1. Kies op de Amazon Fraud Detector-console Modellen in het navigatievenster.
  2. Kies het model dat u zojuist hebt getraind (sample_fraud_detection_model), kies dan 1.0. Dit is de versie die Amazon Fraud Detector van uw model heeft gemaakt.
  3. Geef je mening over de Modelprestaties algemene score en alle andere statistieken die Amazon Fraud Detector voor dit model heeft gegenereerd.

Modelprestaties

Implementeer het model

Nadat u de prestatiestatistieken van uw getrainde model hebt beoordeeld en klaar bent om het te gebruiken om fraudevoorspellingen te genereren, kunt u het model implementeren:

  1. Kies op de Amazon Fraud Detector-console Modellen in het navigatievenster.
  2. Kies het model sample_fraud_detection_modelen kies vervolgens de specifieke modelversie die u wilt implementeren. Kies voor dit bericht 1.0.
  3. Op de Modelversie pagina, op de Acties menu, kies Implementeer de modelversie.

Op de Modelversies pagina, de Status toont de status van de implementatie. De status verandert in Actief wanneer de implementatie voltooid is. Dit geeft aan dat de modelversie is geactiveerd en beschikbaar is om fraudevoorspellingen te genereren.

Een detector maken

Nadat je het model hebt ingezet, bouw je een detector voor de docfraud gebeurtenistype en voeg het geïmplementeerde model toe. Voer de volgende stappen uit:

  1. Kies op de Amazon Fraud Detector-console Detectoren in het navigatievenster.
  2. Kies Maak een detector.
  3. Op de Definieer detectordetails pagina, voer in fraud_detector voor de detectornaam en voer optioneel een beschrijving voor de detector in, zoals mijn voorbeeldfraudedetector.
  4. Voor event Type, kiezen docfraud. Dit is de gebeurtenis die u eerder hebt gemaakt.
  5. Kies Volgende.

Voeg regels toe om te interpreteren

Nadat u het Amazon Fraud Detector-model hebt gemaakt, kunt u de Amazon Fraud Detector-console of application programming interface (API) gebruiken om bedrijfsgestuurde regels te definiëren (voorwaarden die Amazon Fraud Detector vertellen hoe de prestatiescore van het model moet worden geïnterpreteerd bij het evalueren van fraudevoorspellingen) . Om af te stemmen op het hypotheekacceptatieproces, kunt u regels opstellen om hypotheekaanvragen te markeren op basis van de bijbehorende risiconiveaus en die in kaart worden gebracht als fraude, legitiem of als een beoordeling nodig is.

U wilt bijvoorbeeld hypotheekaanvragen met een hoog frauderisico automatisch weigeren, waarbij u rekening moet houden met parameters als geknoeide afbeeldingen van de vereiste documenten, ontbrekende documenten zoals loonstrookjes of inkomensvereisten, enzovoort. Aan de andere kant hebben bepaalde toepassingen mogelijk een mens nodig om effectieve beslissingen te nemen.

Amazon Fraud Detector gebruikt de geaggregeerde waarde (berekend door een reeks onbewerkte variabelen te combineren) en de onbewerkte waarde (de waarde die voor de variabele wordt opgegeven) om de modelscores te genereren. De modelscores kunnen tussen 0 en 1000 liggen, waarbij 0 een laag frauderisico aangeeft en 1000 een hoog frauderisico aangeeft.

Om de respectievelijke bedrijfsgestuurde regels toe te voegen, voert u de volgende stappen uit:

  1. Kies op de Amazon Fraud Detector-console Reglement in het navigatievenster.
  2. Kies Voeg de regel.
  3. In het Definieer een regel sectie, voer fraude in voor de regelnaam en voer optioneel een beschrijving in.
  4. Voor UitdrukkingVoer de regelexpressie in met behulp van de vereenvoudigde regelexpressietaal van Amazon Fraud Detector $docdraud_insightscore >= 900
  5. Voor Resultaten, kiezen Maak een nieuwe uitkomst (Een uitkomst is het resultaat van een fraudevoorspelling en wordt geretourneerd als de regel tijdens een evaluatie overeenkomt.)
  6. In het Maak een nieuwe uitkomst sectie, voer weigering in als uitkomstnaam en een optionele beschrijving.
  7. Kies Bewaar uitkomst
  8. Kies Voeg de regel om de regelvalidatiecontrole uit te voeren en de regel op te slaan.
  9. Nadat het is gemaakt, maakt Amazon Fraud Detector het volgende high_risk regel beschikbaar voor gebruik in uw detector.
    1. Regelnaam: fraud
    2. Resultaat: decline
    3. Expressie: $docdraud_insightscore >= 900
  10. Kies Voeg nog een regel toeen kies vervolgens het Creëer regel tabblad om 2 extra regels toe te voegen, zoals hieronder:
  11. Maak een low_risk regel met de volgende details:
    1. Regelnaam: legit
    2. Resultaat: approve
    3. Expressie: $docdraud_insightscore <= 500
  12. Maak een medium_risk regel met de volgende details:
    1. Regelnaam: review needed
    2. Resultaat: review
    3. Expressie: $docdraud_insightscore <= 900 and docdraud_insightscore >=500

Deze waarden zijn voorbeelden die voor dit bericht worden gebruikt. Wanneer u regels maakt voor uw eigen detector, gebruik dan waarden die geschikt zijn voor uw model en gebruiksscenario.

  1. Nadat u alle drie de regels hebt gemaakt, kiest u Volgende.

Bijbehorende regels

Implementeer de API om voorspellingen te doen

Nadat de op regels gebaseerde acties zijn geactiveerd, kunt u een Amazon Fraud Detector API inzetten om de leenaanvragen te evalueren en potentiële fraude te voorspellen. De voorspellingen kunnen batchgewijs of in realtime worden uitgevoerd.

Implementeer de Amazon Fraud Detector-API

Integreer uw SageMaker-model (optioneel)

Als u al een fraudedetectiemodel in SageMaker heeft, kunt u dit integreren met Amazon Fraud Detector voor uw gewenste resultaten.

Dit houdt in dat u zowel SageMaker- als Amazon Fraud Detector-modellen in uw toepassing kunt gebruiken om verschillende soorten fraude te detecteren. Uw toepassing kan bijvoorbeeld het Amazon Fraud Detector-model gebruiken om het frauderisico van klantaccounts te beoordelen, en tegelijkertijd uw PageMaker-model gebruiken om te controleren op het risico dat accounts worden aangetast.

Opruimen

Om te voorkomen dat er in de toekomst kosten in rekening worden gebracht, verwijdert u de bronnen die voor de oplossing zijn gemaakt, waaronder de volgende:

  • S3 emmer
  • Amazon Fraud Detector-eindpunt

Conclusie

In dit bericht werd u door een geautomatiseerde en op maat gemaakte oplossing geleid om fraude in het hypotheekacceptatieproces op te sporen. Met deze oplossing kunt u frauduleuze pogingen dichter bij het tijdstip van de fraude detecteren en worden verzekeraars geholpen met een effectief besluitvormingsproces. Bovendien stelt de flexibiliteit van de implementatie u in staat om bedrijfsgestuurde regels te definiëren om de frauduleuze pogingen te classificeren en vast te leggen, aangepast aan specifieke zakelijke behoeften.

Voor meer informatie over het bouwen van een end-to-end oplossing voor het detecteren van fraude met hypotheekdocumenten, raadpleegt u Deel 1 en Deel 2 in deze serie.


Over de auteurs


Anup Ravindranath
is een Senior Solutions Architect bij Amazon Web Services (AWS), gevestigd in Toronto, Canada en werkt samen met financiële dienstverleners. Hij helpt klanten om hun bedrijf te transformeren en te innoveren in de cloud.

Vinnie Saini is een Senior Solutions Architect bij Amazon Web Services (AWS), gevestigd in Toronto, Canada. Ze heeft financiële dienstverleners geholpen om te transformeren naar de cloud, met AI- en ML-gestuurde oplossingen die zijn gebaseerd op sterke pijlers van architecturale uitmuntendheid.

spot_img

Laatste intelligentie

spot_img