Zephyrnet Logosu

Amazon Fraud Detector'da bir kavram kanıtı oluşturarak sahtekarlığı daha hızlı yakalamak

Tarih:

Amazon Sahtekarlık Dedektörü sahte hesap oluşturma veya çevrimiçi ödeme sahtekarlığı gibi potansiyel olarak sahtekarlık içeren çevrimiçi etkinlikleri tanımlamayı kolaylaştıran, tam olarak yönetilen bir hizmettir. Genel amaçlı makine öğrenimi (ML) paketlerinin aksine Amazon Fraud Detector, sahtekarlığı tespit etmek için özel olarak tasarlanmıştır. Amazon Fraud Detector, verilerinizi, makine öğrenimi alanındaki en son gelişmeleri ve 20 yıldan fazla sahtekarlık algılama deneyimini bir araya getirir. Amazon.com ve AWS ile işletmenizdeki sahtekarlığı tespit etmek için özel olarak tasarlanmış ML modelleri oluşturun.

Bu gönderi, Amazon Fraud Detector'ın işletmeniz için değerini değerlendirebilmeniz için Online Fraud Insights modeli için sağlam bir kavram kanıtı (POC) geliştirmenize ve çalıştırmanıza yardımcı olur. Online Fraud Insights modeli, yeni hesap dolandırıcılığı, çevrimiçi işlem sahtekarlığı veya sahte incelemeler gibi çeşitli dolandırıcılık türlerini çözmek için uyarlayabileceğiniz denetimli bir ML modelidir. Veri kullanılabilirliğine bağlı olarak, Amazon Fraud Detector POC'lerini genellikle 1-2 hafta gibi kısa bir sürede tamamlayabilirsiniz.

Dolandırıcılık yaşam döngüsü

Dolandırıcılık tüm şekil ve boyutlarda gerçekleşir, ancak genellikle aynı üç aşamalı yaşam döngüsünü izler:

  1. Kötü bir oyuncu platformunuza katılıyor
  2. Kötü oyuncu sahtekarlık yapıyor (genellikle aynı hesapta birden çok kez)
  3. Sonunda dolandırıcılığı keşfeder ve kötü oyuncuyu engellersiniz

Aşağıdaki şema bu yaşam döngüsünü görselleştirmektedir.

Kötü oyuncu ilk önce diyagramın Sıfır Zaman (T0) olarak gösterdiği hesabı kaydeder. Sonraki hileli olaylar T1, T2 ve T3 zamanlarında meydana gelir ve sistem tarafından tespit edilmez. Ters ibraz şeklinde saatler, günler ve hatta haftalar sürebilen zamanda (TN) daha sonraki bir noktada, sahtekarlığı keşfeder ve kötü oyuncuyu engellersiniz.

Dolandırıcılığı geç keşfetmenin maliyeti yüksektir. Satılan malların maliyeti, insan incelemelerinin maliyeti ve ters ibrazlarla ilişkili ücretlerle ilgili finansal maliyetler vardır. Ayrıca, şirket için itibar veya yasal riskler olabilir. Mükemmel senaryoda, sahtekarlığı tahmin edebilir ve herhangi bir hasar oluşmadan önce durdurabilirsiniz. Bunun bir yolu, kötü oyuncuları hesabı (T0) kaydettikleri anda yakalamak ve onları ilk etapta platforma asla girmelerine izin vermemek.

Amazon Fraud Detector'ın yardımcı olabileceği yer burasıdır. Kimlerin sahtekarlık yapabileceğini tahmin eden özel bir model oluşturabilir ve bilgileri sahtekarlığı gerçekleşmeden önce önlemeye (veya en aza indirmeye) yardımcı olmak için kullanabilirsiniz.. Bazı durumlarda Amazon Fraud Detector, dolandırıcılığın% 95'e kadar daha hızlı tespit edilmesine yardımcı oldu.

Online Fraud Insights modeli ile bir POC tasarlarken, kötü oyuncuları olabildiğince T0'a yakın tespit eden bir model oluşturmalısınız (ideal olarak hesap kaydında). Genişletilmiş bir POC'nin parçası olarak, daha sonraki yüksek riskli olaylarda (işlemler gibi) kötü aktörleri tespit eden ek modeller de oluşturabilirsiniz.

İOOY'nizi çevrimiçi dolandırıcılık içgörüleri için planlama

Online Fraud Insights modeliyle bir POC kullanmaya başlamak için aşağıdakileri göz önünde bulundurun:

  • Özel kullanım durumunuz - Online Fraud Insights modeli, yeni hesap dolandırıcılığı, işlem sahtekarlığı veya sahte incelemelerin kötüye kullanımı gibi çok sayıda çevrimiçi dolandırıcılık ve kötüye kullanım türünü tespit etmede iyi çalışır. Bu yazı itibariyle, hesap devralmayı (ATO) tespit edemiyor.
  • Yaşam döngüsünde dolandırıcılığı tespit etmek istediğinizde - Bu, doğru POC'yi tasarlamanın önemli bir bileşenidir. Dolandırıcılığı daha erken tespit etmek en iyisidir.

POC'nizi üç aşamaya ayırmalısınız:

  1. Eğitim verilerini toplama - Modeli eğitmek için kullanılacak verileri toplayın.
  2. Modeli eğitme ve dedektörü yapılandırma - Modeli oluşturun ve işletmelerinizdeki dolandırıcılığı tespit edecek şekilde eğitin. Eğitilmiş model ve kuralların bir birleşimi olan bir algılayıcı oluşturun.
  3. Performansı değerlendirme - Amazon Fraud Detector'ın sahtekarlığı daha hızlı yakalayıp yakalamadığını ve dolandırıcılık kayıplarınızı azaltıp azaltmadığını belirleyin

POC'yi ücretsiz deneme süresi içinde tamamlayabilirsiniz ve genellikle 1–2 hafta sürer. Kullanım durumunuzla ilgili yardıma ihtiyacınız varsa, Amazon Fraud Detector ekibiyle iletişime geçin.

Eğitim verilerini toplama

POC'nin ilk adımı, modeli eğitmek için ilgili verileri toplamaktır.

Nadir durumlar dışında, daha fazla veri genellikle daha az verilerden daha iyidir. Amazon Fraud Detector, modeli eğitmek için en az 10,000 kayıt gerektirir ve bu kayıtların en az 500'ü sahte olarak belirlenir; ancak, ne kadar çok kayıt ve dolandırıcılık örneği verirseniz o kadar iyidir. Bu, yapay olarak örnekler oluşturmanız gerektiği anlamına gelmez, sadece daha fazla tarihi olay eklemeniz gerekir. En az 3-6 aylık veri toplamalısınız.

Bir dolandırıcılık tespit modelini eğitirken, şu verileri kullanmak istersiniz: olgunBu, dolandırıcılık yaşam döngüsünün tamamlandığı anlamına gelir. Kullanım durumuna bağlı olarak bu 30-45 gün veya daha uzun sürebilir. Örneğin, kartsız işlem (ters ibraz) sahtekarlığının tespit edilmesi durumunda, bir sahtekarlık ödemesinin belirlenmesi genellikle bir açıklama döngüsü alır. Eğitim veri kümenizdeki en son veriler en az 4-6 haftalık olmalıdır, ancak hangi verilerin dolandırıcılık Yaşam Döngüsünü tamamlayacak kadar eski olduğuna karar verirken en iyi kararınızı kullanın.

Özet olarak, modeli eğitmek için aşağıdaki en iyi uygulamalara uyun:

  • 10,000'ü dolandırıcılık örnekleri olmak üzere en az 500 kayıt kullanın (ancak daha fazlası her zaman daha iyidir).
  • Eğitim verileri 3-6 aydır (daha az işe yarasa da). En eski veriler bir yıldan eski değildir.
  • Her işletme farklı olsa da, veri kümesi en az 4 haftalık olgundur.

Modeli eğitme ve dedektörü yapılandırma

Artık eğitim verilerinizi topladığınıza göre, bir model eğitmenin ve bir dedektör yaratmanın zamanı geldi. Daha fazla bilgi için aşağıdakilere bakın:

AWS SDK'yı kullanarak bu kaynakları programlı olarak oluşturma hakkında daha fazla bilgi için veya AWS Komut Satırı Arayüzü (AWS CLI), bakın GitHub repo.

Model puan eşiği seçme

Modeliniz 0 (en az riskli) ile 1,000 (en riskli) arasında puanlar üretir. Yanlış pozitifleri dengelerken kabul edilebilir bir dolandırıcılık yakalama oranı belirlemek için puan eşiğini kullanmalısınız. Örneğin, sahte hesap kayıtlarını belirlemek istediğinizi varsayalım. Aşağıdaki tablo, 500 puan eşiğinde (yani, 500 veya üzeri herhangi bir puan dolandırıcılık olarak etiketlenir) dolandırıcı hesap kayıtlarının% 53.2'sini yakaladığını göstermektedir. Ayrıca, meşru olayların% 0.4'ünün yanlışlıkla sahtekarlık olarak sınıflandırıldığını da göstermektedir.

Amazon Fraud Detector, aynı bilgilerin tablo halinde bir görünümünü de sağlar. Aşağıdaki görüntü, 150 puan eşiğinde (150 veya üzeri herhangi bir puanın dolandırıcılık olarak etiketlendiği anlamına gelir), sahte hesap kayıtlarının% 74'ünü yakaladığını göstermektedir. Ayrıca, meşru olayların% 3'ünün yanlışlıkla dolandırıcılık olarak sınıflandırıldığını da gösteriyor.

Performansı değerlendirme

Önceki adımları tamamladıktan sonra, aşağıdaki resimlerde gösterildiği gibi dolandırıcılık kullanım durumunuz için aktif bir modeliniz ve dedektör yapınız olur.

Amazon Fraud Detector'ın işletmenize ne kadar değer sağladığını değerlendirmek için artık bu modeli ve algılayıcıyı kullanabilirsiniz. Bunu yapmak için, AWS SDK'yı kullanarak sahtekarlık tahminleri oluşturmanız gerekir ve GetPrediction API. GetPrediction API, yeni bir olayı (hesap kaydı gibi) alır ve dedektör kurallarına göre modele ve sonuca göre bir dolandırıcılık puanı verir. Modeli en son verileri veya 30 gün öncesine kadar olan verileri kullanarak test etmelisiniz. Bu, test veri kümesinin eğitim veri kümenizle çakışmamasını sağlar. Modeli en azından 1,000 haftalık bir dönem boyunca 5,000–2 kayıt üzerinde test edin. Modelin dolandırıcılığı belirlemedeki etkinliğini yeterince değerlendirmek için yeterli veri istiyorsunuz.

Çalıştırma hakkında daha fazla bilgi için GetPrediction API toplu halde, bkz. Dolandırıcılık Dedektörü Predict API GitHub'da. Sentetik veri kümesini test veri kümenizle değiştirmelisiniz. Modeli elinizdeki en son verilerle test etmek istiyorsunuz, bu nedenle son günden (veya haftadan) veriler, model performansını değerlendirmek için çok değerlidir.

Kullanım durumunuza ve veri mevcudiyetinize bağlı olarak aşağıdaki değerlendirme stratejilerinden birini düşünebilirsiniz:

  • Dolandırıcılığı tespit etme zamanı
  • Dolar kurtarıldı
  • Araştırma verimi

Dolandırıcılığı tespit etme zamanı

Amazon Fraud Detector'ın değer katıp katmadığını belirlemenin bir yolu, dolandırıcılığı tespit etme süresi (TTDF) ölçüsünü kullanarak karşılaştırma yapmaktır. Kötü aktör dolandırıcılık Yaşam Döngüsüne başladığı andan itibaren TTDF'yi ölçersiniz. Aşağıdaki şema (daha önce de gösterilmiştir) dolandırıcılık tespit zaman çizelgesini göstermektedir.

TTDF, hesap kaydında (T0) başlar ve T0 ile TN arasındaki fark olarak tanımlanır. Amaç TTDF'yi en aza indirmektir. POC'nin bir parçası olarak, ortalama TTDF'nizin düşüp düşmediğini belirleyebilirsiniz.

Bu kullanım örneğinde, kayıt sırasında dolandırıcılığı tespit etmek için Amazon Fraud Detector'da bir model oluşturmak istiyorsunuz (T0). TTDF'yi hesaplamak için aşağıdakileri yapmanız gerekir:

  1. İşletmeniz için gerçek pozitif oran ile yanlış pozitif oranını dengeleyen doğru model puan eşiğini belirlemek için model performans metriklerini kullanın. % 1'lik bir yanlış pozitif oranı, model eşiğini seçerken iyi bir başlangıç ​​noktasıdır, ancak ideal sınır risk toleransınıza ve hangi işlemi gerçekleştirdiğinize (hesabı engelleme veya manuel inceleme için gönderme gibi) bağlıdır.
  2. Dolandırıcılık puanları ve sonuçları oluşturmak için Amazon Fraud Detector aracılığıyla yeni hesap kayıtlarının bir örneğini çalıştırın. Her olay için, olayın meydana geldiği zamanın zaman damgasını (T0), risk puanını ve sonucu kaydedin. Bu olay hileli olarak işaretlenirse, dolandırıcılık kararının verildiği zamanın zaman damgasını kaydedin (TN).
  3. Hileli olarak işaretlenen olaylar için TN'yi T0'dan çıkarın. Bu TTDF'dir.

İdeal bir senaryoda, Amazon Fraud Detector'ın toplam dolandırıcılığın önemli bir bölümünü belirlediğini ve TTDF'nin mevcut sisteminizden daha kısa olduğunu görüyorsunuz.

Dolar kurtarıldı

TTDF stratejisinin bir uzantısı olarak, mevcut yaklaşımınızla karşılaştırıldığında tasarruf edilen doları da tahmin edebilirsiniz. Online Fraud Insights modeli, herkesin içeri girmesine izin vermek ve dolandırıcılığı olaydan sonra tespit etmek (azaltma) yerine, kötü aktörleri Yaşam Döngüsünün başlarında durdurmak (önleme) için tasarlanmıştır. Kötü oyuncuların bir hesap açmasını durdurursanız, işinizdeki sonraki faaliyetlerinin etkisini önemli ölçüde sınırlayabilirsiniz. Bu kullanım örneği için, kayıt sırasında (T0) kötü oyuncuları tespit etmek istediğinizi varsayalım.

Kaydedilen dolarlarınızı karşılaştırmak için aşağıdakileri tamamlamanız gerekir:

  1. İşletmeniz için gerçek pozitif oran ile yanlış pozitif oranını dengeleyen doğru model puan eşiğini belirlemek için model performans metriklerini kullanın. % 1'lik bir yanlış pozitif oranı, model eşiğini seçerken iyi bir başlangıç ​​noktasıdır, ancak ideal sınır risk toleransınıza ve hangi eylemi gerçekleştirdiğinize bağlıdır.
  2. Dolandırıcılık puanları ve sonuçları oluşturmak için kayıt olaylarının test örneğini Amazon Fraud Detector aracılığıyla çalıştırın. Her olay için, olayın meydana geldiği zamanın zaman damgasını (T0), risk puanını ve sonucu kaydedin. Bu olay hileli olarak işaretlenirse, dolandırıcılık kararının ne zaman verildiğine (TN) ait zaman damgasını ve dolar cinsinden dolandırıcılık kayıplarını kaydedin.
  3. Aşağıdakileri sayın:
    1. Puan eşiğine göre sahtekarlık olayları önlendi. Her dolandırıcılık olayı için, kayıpları dolar olarak saklamayı unutmayın. Bu veriler mevcut değilse, bir tahmin kullanın.
    2. Puan eşiğine göre hatalı bir şekilde hileli olarak tanımlanan meşru olaylar. Yanlış belirlenen her bir meşru olay için, kaybedilen potansiyel geliri veya yanlış pozitifin araştırılmasıyla ilişkili maliyeti tahmin edin.
  4. Her bölüm için sayıları alın ve etkinlik başına maliyete göre çoğaltın. Örneğin, 1,000'si dolandırıcılık ve 20'i meşru olan 980 olaydan aşağıdakileri bulabilirsiniz:
    1. Model, kayıt sırasında 10 dolandırıcılık olayından 20'unu başarıyla belirleyerek dolandırıcılığın meydana gelmesini önledi. Her bir dolandırıcılık olayı için, dolandırıcılık kayıplarının 150 ABD doları olduğunu varsayın, bu nedenle, azaltılmış toplam dolandırıcılık kayıpları 10 x 150 ABD Doları = 1,500 ABD Dolarıdır.
    2. Model, yasal nüfusun% 1'ini yanlışlıkla potansiyel olarak sahtekar olarak işaretledi ve bu nedenle, 10 müşteriyi potansiyel olarak sahtekar olarak işaretledi. Bu müşteriler manuel olarak araştırılmıştır ve bu, inceleme başına 5 ABD dolarıdır. Yanlış pozitiflerin toplam maliyeti 10 x 5 $ = 50 $ 'dır.
  5. Azaltılmış dolandırıcılık kayıplarını alarak ve yanlış pozitiflerin maliyetini ve Amazon Fraud Detector'ı çalıştırmanın maliyetini çıkararak tasarruf edilen toplam doları hesaplayın. Bu kullanım senaryosu için, her bir değerlendirmenin değerlendirme başına 0.03 ABD doları maliyeti olduğunu varsayarsanız, tasarruf ettiğiniz toplam dolar 1,500 ABD doları (dolandırıcılık kayıpları azaltılmış) - 50 ABD doları (yanlış pozitiflerin maliyeti) - 30 ABD doları (Amazon Fraud Detector çalıştırma maliyeti) = 1,420 ABD doları tasarruf olur.
  6. Seçtiğiniz puan eşiğine göre Amazon Fraud Detector'ın dolarlarını, sayılarını ve yüzdelerini mevcut dolandırıcılık sisteminizle karşılaştırın.

İdeal olarak Amazon Fraud Detector, mevcut çözümünüzle karşılaştırıldığında önemli bir tasarruf sağlar.

Araştırma verimi

Amazon Fraud Detector'ı karşılaştırmanın başka bir yolu da manuel araştırma getirisini mevcut dolandırıcılık sisteminizle karşılaştırmaktır. Verim, hileli olduğu ortaya çıkan soruşturma sayısının toplam soruşturma sayısına bölünmesiyle elde edilir. İdeal olarak, verim oranınızın yüksek olmasını istersiniz, böylece insan araştırmacılarınız yanlış pozitifleri araştırmak için zaman kaybetmesinler.

Araştırma getirinizi karşılaştırmak için aşağıdakileri tamamlayın:

  1. İşletmeniz için gerçek pozitif oran ile yanlış pozitif oranını dengeleyen doğru model puan eşiğini belirlemek için model performans metriklerini kullanın. % 5'lik bir yanlış pozitif oranı, model eşiğini seçerken iyi bir başlangıç ​​noktasıdır, ancak ideal sınır risk toleransınıza bağlıdır.
  2. Dolandırıcılık puanları ve sonuçları oluşturmak için Amazon Fraud Detector aracılığıyla bir olay örneği çalıştırın.
  3. Araştırma için kaç olay gönderdiğiniz (toplam araştırma sayısı veya TIC) ve araştırılan olaylardan kaç tanesinin hileli olarak işaretlendiğini (FIC'nin dolandırıcılık inceleme sayısı) kaydedin.
  4. Araştırma verimini hesaplamak için, FIC'yi TIC'ye bölün.
  5. Amazon Fraud Detector'ın getirisini mevcut dolandırıcılık sisteminizin getirisiyle karşılaştırın.

İdeal olarak, Amazon Fraud Detector ile veriminiz daha yüksektir ve ayrıca yeterli miktarda sahtekarlığı yakalar.

Sonuç

Başarılı bir POC'ye sahip olduktan sonra, dedektörünüzü bir gölge modunda çalıştırarak veya üretim trafiğini dedektöre yönlendirerek canlı bir sisteme geçiş yapabilirsiniz. Bir gölge moduna veya üretime geçiş, bu gönderinin kapsamı dışındadır, ancak AWS Çözüm Mimarları, uygulamanın bir sonraki aşamasında çalışmanıza yardımcı olmaya hazırdır.


Yazarlar Hakkında

Chris Porter, Amazon Fraud Detector üzerinde çalışan Kıdemli Ürün Yöneticisidir. Makine öğreniminden yararlanarak AWS müşterilerinin sahtekarlığı durdurmalarına yardımcı olma konusunda tutkulu. Boş zamanlarında yürüyüş yapmaktan, kayak yapmaktan ve Kuzeybatı Pasifik dağlarını keşfetmekten hoşlanıyor.

Mike Ames, Amazon Fraud Detector üzerinde çalışan bir Araştırma Bilimi Yöneticisidir. Şirketlerin dolandırıcılık, israf ve kötüye kullanımla mücadele etmek için makine öğrenimini kullanmasına yardımcı oluyor. Boş zamanlarında onu 90'ların metaline elektrikli mandolin ile sıkışırken bulabilirsiniz.

Kaynak: https://aws.amazon.com/blogs/machine-learning/catching-fraud-faster-by-building-a-proof-of-concept-in-amazon-fraud-detector/

spot_img

En Son İstihbarat

spot_img