Zephyrnet-logo

Voer batchfraude-voorspellingen uit met Amazon Fraud Detector zonder code te schrijven of een API te integreren

Datum:

Amazone fraude detector is een volledig beheerde dienst die het gemakkelijk maakt om mogelijk frauduleuze online activiteiten te identificeren, zoals het aanmaken van nepaccounts of online betalingsfraude. In tegenstelling tot ML-pakketten (machine learning) voor algemene doeleinden, is Amazon Fraud Detector specifiek ontworpen om fraude op te sporen. Amazon Fraud Detector combineert uw gegevens, het nieuwste op het gebied van ML-wetenschap en meer dan 20 jaar ervaring met fraudedetectie van Amazon.com en AWS om ML-modellen te bouwen die op maat zijn gemaakt om fraude in uw bedrijf te detecteren.

Nadat u een fraudedetectiemodel hebt getraind dat is aangepast aan uw bedrijf, maakt u regels om de uitvoer van het model te interpreteren en maakt u een detector die zowel het model als de regels bevat. U kunt online activiteiten vervolgens in realtime evalueren op fraude door uw detector te bellen via het GetEventPrediction API en het doorgeven van details over een enkele gebeurtenis in elk verzoek. Maar wat als u niet over de technische ondersteuning beschikt om de API te integreren, of als u snel veel evenementen tegelijk wilt evalueren? Voorheen was dat nodig maak een oplossing op maat gebruik AWS Lambda en Amazon eenvoudige opslagservice (Amazon S3). Hiervoor moest u code schrijven en onderhouden, en het kon maximaal 4,000 gebeurtenissen tegelijk evalueren. Nu kunt u batchvoorspellingen genereren in Amazon Fraud Detector om snel en eenvoudig een groot aantal gebeurtenissen op fraude te beoordelen.

Overzicht oplossingen

Om de functie voor batchvoorspellingen te gebruiken, moet u de volgende stappen op hoog niveau voltooien:

  1. Maak en publiceer een detector die uw voorspellingsmodel en regels voor fraude bevat, of gewoon een regelset.
  2. Maak een invoer-S3-bucket om uw bestand naar te uploaden en, optioneel, een uitvoer-bucket om uw resultaten op te slaan.
  3. Maak een CSV-bestand met alle gebeurtenissen die u wilt evalueren.
  4. Voer een batchvoorspellingstaak uit via de Amazon Fraud Detector-console.
  5. Bekijk uw resultaten in het CSV-bestand dat wordt gegenereerd en opgeslagen op Amazon S3.

Maak en publiceer een detector

U kunt een detectorversie maken en publiceren met de Amazon Fraud Detector-console of via de API's. Zie voor console-instructies Aan de slag (console).

Maak de S3-buckets voor invoer en uitvoer

Maak een S3-bucket op de Amazon S3-console waar u uw CSV-bestanden uploadt. Dit is je invoerbak. Optioneel kunt u een tweede uitvoerbucket maken waarin Amazon Fraud Detector de resultaten van uw batchvoorspellingen opslaat als CSV-bestanden. Als u geen uitvoerbucket opgeeft, slaat Amazon Fraud Detector zowel uw invoer- als uitvoerbestanden op in dezelfde bucket.

Zorg ervoor dat u uw emmers maakt in dezelfde regio als uw detector. Zie voor meer informatie Een bucket maken.

Maak een voorbeeld van een CSV-bestand met gebeurtenisrecords

Maak een CSV-bestand met de gebeurtenissen die u wilt evalueren. Voeg in dit bestand een kolom toe voor elke variabele in het gebeurtenistype dat aan uw detector is gekoppeld. Voeg daarnaast kolommen toe voor:

  • EVENT_ID - Een identificatie voor de gebeurtenis, zoals een transactienummer. De veldwaarden moeten voldoen aan het volgende reguliere-expressiepatroon: ^ [0-9a-z _-] + $.
  • ENTITY_ID - Een identificatiecode voor de entiteit die de gebeurtenis uitvoert, zoals een rekeningnummer. De veldwaarden moeten ook voldoen aan het volgende reguliere-expressiepatroon: ^ [0-9a-z _-] + $.
  • EVENT_TIMESTAMP - Een tijdstempel, in ISO 8601-indeling, voor wanneer de gebeurtenis plaatsvond.
  • ENTITY_TYPE - De entiteit die het evenement uitvoert, zoals een klant of een handelaar.

Kolomkopnamen moeten exact overeenkomen met de overeenkomstige variabelenamen van Amazon Fraud Detector. De voorgaande vier vereiste kolomkopnamen moeten hoofdletters zijn en de kolomkopnamen voor de variabelen die aan uw gebeurtenistype zijn gekoppeld, moeten kleine letters zijn. U ontvangt een foutmelding voor alle gebeurtenissen in uw bestand waarvoor waarden ontbreken.

In uw CSV-bestand komt elke rij overeen met één gebeurtenis waarvoor u een voorspelling wilt genereren. Het CSV-bestand mag maximaal 50 MB groot zijn, wat ongeveer 50,000-100,000 evenementen mogelijk maakt, afhankelijk van de grootte van uw evenement. De volgende schermafbeelding toont een voorbeeld van een ingevoerd CSV-bestand.

Zie voor meer informatie over variabele gegevenstypen en opmaak van Amazon Fraud Detector Maak een variabele.

Voer een batchvoorspelling uit

Upload uw CSV-bestand naar uw invoerbucket. Nu is het tijd om een ​​batchvoorspellingstaak te starten.

  1. Kies op de Amazon Fraud Detector-console Batch-voorspellingen in het navigatievenster.

Deze pagina bevat een samenvatting van eerdere batchvoorspellingstaken.

  1. Kies Nieuwe batchvoorspelling.

  1. Voor Taaknaam¸ u kunt een naam voor uw baan invoeren of Amazon Fraud Detector een willekeurige naam laten toewijzen.
  2. Voor Detector en Detector versie, kies de detector en versie die u wilt gebruiken voor uw batchvoorspelling.
  3. Voor IAM-rol, als u al een AWS Identiteits- en toegangsbeheer (IAM) -rol, kunt u deze kiezen in het vervolgkeuzemenu. U kunt er ook een maken door te kiezen Maak een IAM-rol.

Wanneer u een nieuwe IAM-rol maakt, kunt u verschillende buckets opgeven voor de invoer- en uitvoerbestanden of voor beide dezelfde bucketnaam invoeren.

Als u een bestaande IAM-rol gebruikt, zoals degene die u gebruikt voor toegang tot datasets voor modeltraining, moet u ervoor zorgen dat de rol de s3:PutObject toestemming bijgevoegd voordat een batchvoorspellingstaak wordt gestart.

  1. Nadat je je IAM-rol hebt gekozen, voor Gegevenslocatie, voer de S3 URI voor uw invoerbestand in.
  2. Kies Start.

U bent teruggekeerd naar de Batch-voorspellingen pagina, waar u de vacature kunt zien die u zojuist hebt gemaakt. Verwerkingstijden voor batchvoorspellingstaken variëren op basis van het aantal gebeurtenissen dat u evalueert. Een bestand van 20 MB (ongeveer 20,000 gebeurtenissen) duurt bijvoorbeeld ongeveer 12 minuten. U kunt de status van de taak op elk moment bekijken op de Amazon Fraud Detector-console. Als u de taaknaam kiest, wordt een taakdetailpagina geopend met aanvullende informatie, zoals de invoer- en uitvoergegevenslocaties.

Bekijk de resultaten van uw batchvoorspelling

Nadat de taak is voltooid, kunt u uw uitvoerbestand downloaden vanuit de S3-bucket die u hebt aangewezen. Kies de link onder om het bestand snel te vinden Uitvoergegevens locatie op de vacaturepagina.

Het uitvoerbestand bevat alle kolommen die u in uw invoerbestand heeft opgegeven, plus drie extra kolommen:

  • STATUS - Shows Success als de gebeurtenis met succes is geëvalueerd of een foutcode als de gebeurtenis niet kan worden geëvalueerd
  • RESULTATEN - Geeft aan welke uitkomsten zijn geretourneerd door uw regelset
  • MODEL_SCORES - Geeft de risicoscores aan die zijn geretourneerd door modellen die door uw regelset zijn aangeroepen

De volgende schermafbeelding toont een voorbeeld van een CSV-uitvoerbestand.

Conclusie

Proficiat! U hebt met succes een reeks fraudevoorspellingen uitgevoerd. U kunt de functie voor batchvoorspellingen gebruiken om wijzigingen in uw fraudedetectielogica te testen, zoals een nieuwe modelversie of bijgewerkte regels. U kunt ook batchvoorspellingen gebruiken om asynchrone fraude-evaluaties uit te voeren, zoals een dagelijkse controle van alle accounts die in de afgelopen 24 uur zijn gemaakt.

Afhankelijk van uw gebruikssituatie, wilt u uw voorspellingsresultaten misschien gebruiken in andere AWS-services. U kunt bijvoorbeeld de voorspellingsresultaten analyseren in Amazon QuickSight of stuur resultaten met een hoog risico naar Amazon Augmented AI (Amazon A2I) voor een menselijke beoordeling van de voorspelling. Misschien wilt u ook gebruiken Amazon Cloud Watch om terugkerende batchvoorspellingen te plannen.

Amazon Fraud Detector heeft een gratis proefperiode van 2 maanden met 30,000 voorspellingen per maand. Daarna beginnen de prijzen bij $ 0.005 per voorspelling voor voorspellingen met alleen regels en $ 0.03 voor voorspellingen op basis van ML. Zie voor meer informatie Prijzen van Amazon Fraud Detector. Voor meer informatie over Amazon Fraud Detector, inclusief links naar aanvullende blogposts, voorbeeldnotitieblokken, gebruikershandleiding en API-documentatie, zie Amazone fraude detector.

Als je vragen of opmerkingen hebt, laat het ons weten in de comments!


Over de auteur

Bilal Ali is een Sr. Product Manager die werkt aan Amazon Fraud Detector. Hij luistert naar de problemen van klanten en vindt manieren om hen te helpen fraude en misbruik beter te bestrijden. In zijn vrije tijd kijkt hij naar oude Jeopardy-afleveringen en zoekt hij naar de beste taco's in Austin, TX.

Coinsmart. Beste Bitcoin-beurs in Europa
Bron: https://aws.amazon.com/blogs/machine-learning/perform-batch-fraud-predictions-with-amazon-fraud-detector-without-writing-code-or-integrating-an-api/

spot_img

Laatste intelligentie

spot_img

Chat met ons

Hallo daar! Hoe kan ik u helpen?