जेफिरनेट लोगो

Amazon फ्रॉड डिटेक्टर में नए अकाउंट टेकओवर इनसाइट्स मॉडल के साथ लॉगिन पर अकाउंट टेकओवर को रोकें

दिनांक:

डिजिटल नया सामान्य है, और कोई पीछे नहीं हट रहा है। हर साल, उपभोक्ता औसतन 191 वेबसाइटों या सेवाओं पर जाते हैं, जिनके लिए उपयोगकर्ता नाम और पासवर्ड की आवश्यकता होती है, और डिजिटल फुटप्रिंट के तेजी से बढ़ने की उम्मीद है। इतना अधिक एक्सपोजर स्वाभाविक रूप से खाता अधिग्रहण (एटीओ) जैसे अतिरिक्त जोखिम लाता है।

हर साल, बुरे अभिनेता चोरी किए गए क्रेडेंशियल्स, फ़िशिंग, सोशल इंजीनियरिंग और एटीओ के कई रूपों के माध्यम से अरबों खातों से समझौता करते हैं। इसे परिप्रेक्ष्य में रखने के लिए: 90 की तुलना में 11.4 में खाता अधिग्रहण धोखाधड़ी 2021% बढ़कर अनुमानित $ 2020 बिलियन हो गई। वित्तीय प्रभाव से परे, एटीओ ग्राहक अनुभव को नुकसान पहुंचाते हैं, ब्रांड की वफादारी और प्रतिष्ठा को खतरा देते हैं, और धोखाधड़ी टीमों को तनाव में डालते हैं क्योंकि वे चार्जबैक का प्रबंधन करते हैं और ग्राहक का दावा।

कई कंपनियां, यहां तक ​​​​कि परिष्कृत धोखाधड़ी टीमों के साथ, समझौता किए गए खातों का पता लगाने के लिए नियम-आधारित समाधानों का उपयोग करते हैं क्योंकि वे बनाना आसान है। अपने बचाव को मजबूत करने और वैध उपयोगकर्ताओं के लिए घर्षण को कम करने के लिए, व्यवसाय खाता अधिग्रहण का पता लगाने के लिए एआई और मशीन लर्निंग (एमएल) में तेजी से निवेश कर रहे हैं।

AWS जैसे समाधानों के साथ आपकी धोखाधड़ी शमन में सुधार करने में आपकी सहायता कर सकता है: अमेज़ॅन फ्रॉड डिटेक्टर. यह पूरी तरह से प्रबंधित एआई सेवा आपको एमएल विशेषज्ञता के बिना कस्टम एमएल धोखाधड़ी का पता लगाने वाले मॉडल को प्रशिक्षित करने में सक्षम बनाकर संभावित धोखाधड़ी ऑनलाइन गतिविधियों की पहचान करने की अनुमति देती है।

इस पोस्ट में चर्चा की गई है कि Amazon फ्रॉड डिटेक्टर में नए अकाउंट टेकओवर इनसाइट्स (ATI) मॉडल का उपयोग करके रीयल-टाइम डिटेक्टर एंडपॉइंट कैसे बनाया जाए।

समाधान का अवलोकन

अमेज़ॅन धोखाधड़ी डिटेक्टर कई उपयोग मामलों में धोखाधड़ी की घटनाओं का पता लगाने के लिए विशिष्ट एल्गोरिदम, संवर्धन, और सुविधा परिवर्तनों के साथ विशिष्ट मॉडल पर निर्भर करता है। नया लॉन्च किया गया अति मॉडल एक कम विलंबता धोखाधड़ी का पता लगाने वाला एमएल मॉडल है जिसे संभावित रूप से समझौता किए गए खातों और एटीओ धोखाधड़ी का पता लगाने के लिए डिज़ाइन किया गया है। एटीआई मॉडल वैध उपयोगकर्ताओं के लिए घर्षण के स्तर को कम करते हुए पारंपरिक नियम-आधारित खाता अधिग्रहण समाधानों की तुलना में चार गुना अधिक एटीओ धोखाधड़ी का पता लगाता है।

ATI मॉडल को आपके व्यवसाय के ऐतिहासिक लॉगिन ईवेंट वाले डेटासेट का उपयोग करके प्रशिक्षित किया जाता है। इवेंट लेबल मॉडल प्रशिक्षण के लिए वैकल्पिक हैं क्योंकि अति मॉडल अनुपयोगी शिक्षण के लिए एक अभिनव दृष्टिकोण का उपयोग करता है। मॉडल वास्तविक खाता स्वामी (वैध घटनाओं) द्वारा उत्पन्न घटनाओं को खराब अभिनेताओं (विसंगत घटनाओं) द्वारा उत्पन्न घटनाओं से अलग करता है।

अमेज़ॅन फ्रॉड डिटेक्टर प्रदान किए गए डेटा को लगातार एकत्र करके उपयोगकर्ता के पिछले व्यवहार को प्राप्त करता है। उपयोगकर्ता व्यवहार के उदाहरणों में यह शामिल है कि उपयोगकर्ता ने किसी विशिष्ट IP पते से कितनी बार साइन इन किया है। इन अतिरिक्त संवर्द्धन और समुच्चय के साथ, अमेज़ॅन फ्रॉड डिटेक्टर आपके लॉगिन ईवेंट से इनपुट के एक छोटे से सेट से मजबूत मॉडल प्रदर्शन उत्पन्न कर सकता है।

वास्तविक समय की भविष्यवाणी के लिए, आप कॉल करें GetEventPrediction एटीओ के जोखिम को मापने के लिए उपयोगकर्ता द्वारा वैध लॉगिन प्रमाण-पत्र प्रस्तुत करने के बाद एपीआई। जवाब में, आपको 0-1000 के बीच एक मॉडल स्कोर प्राप्त होता है, जहां 0 कम धोखाधड़ी जोखिम दिखाता है और 1000 उच्च धोखाधड़ी जोखिम दिखाता है, और आपके द्वारा परिभाषित व्यावसायिक नियमों के एक सेट के आधार पर परिणाम। फिर आप अपनी ओर से उचित कार्रवाई कर सकते हैं: लॉगिन को स्वीकृत करें, लॉगिन को अस्वीकार करें, या एक अतिरिक्त पहचान सत्यापन लागू करके उपयोगकर्ता को चुनौती दें।

आप एटीआई मॉडल का उपयोग एसिंक्रोनस रूप से खाता लॉगिन का मूल्यांकन करने और परिणाम के आधार पर कार्रवाई करने के लिए भी कर सकते हैं, जैसे कि एक जांच कतार में खाते को जोड़ना ताकि एक मानव समीक्षक यह निर्धारित कर सके कि क्या आगे की कार्रवाई की जानी चाहिए।

निम्नलिखित कदम धोखाधड़ी की भविष्यवाणी उत्पन्न करने के लिए एक अति मॉडल के प्रशिक्षण और एक डिटेक्टर समापन बिंदु प्रकाशित करने की प्रक्रिया की रूपरेखा तैयार करते हैं:

  • डेटा तैयार करें और मान्य करें।
  • निकाय, ईवेंट और ईवेंट वेरिएबल और ईवेंट लेबल (वैकल्पिक) को परिभाषित करें.
  • घटना डेटा अपलोड करें।
  • मॉडल प्रशिक्षण शुरू करें।
  • मॉडल का मूल्यांकन करें।
  • एक डिटेक्टर एंडपॉइंट बनाएं और व्यावसायिक नियमों को परिभाषित करें।
  • वास्तविक समय की भविष्यवाणियां प्राप्त करें।

.. पूर्वापेक्षाएँ

आरंभ करने से पहले, निम्नलिखित आवश्यक चरणों को पूरा करें:

डेटा तैयार करें और मान्य करें

Amazon फ्रॉड डिटेक्टर के लिए आवश्यक है कि आप अपना उपयोगकर्ता खाता लॉगिन डेटा UTF-8 प्रारूप में एन्कोडेड CSV फ़ाइल में प्रदान करें। अति के लिए, आपको अपनी CSV फ़ाइल की शीर्षलेख पंक्ति में कुछ ईवेंट मेटाडेटा और ईवेंट चर प्रदान करने होंगे।

आवश्यक घटना मेटाडेटा इस प्रकार है:

  • EVENT_ID - लॉगिन इवेंट के लिए एक विशिष्ट पहचानकर्ता।
  • इकाई प्रकार - वह इकाई जो लॉगिन इवेंट करती है, जैसे कि कोई व्यापारी या ग्राहक।
  • ENTITY_ID - लॉगिन इवेंट करने वाली इकाई के लिए एक पहचानकर्ता।
  • EVENT_TIMESTAMP - टाइमस्टैम्प जब लॉगिन घटना हुई। टाइमस्टैम्प प्रारूप UTC में ISO 8601 मानक में होना चाहिए।
  • EVENT_LABEL (वैकल्पिक) - एक लेबल जो घटना को कपटपूर्ण या वैध के रूप में वर्गीकृत करता है। आप धोखाधड़ी, वैध, 1, या 0 जैसे किसी भी लेबल का उपयोग कर सकते हैं।

इवेंट मेटाडेटा अपरकेस अक्षरों में होना चाहिए। लॉगिन इवेंट के लिए लेबल की आवश्यकता नहीं है। हालांकि, हम अनुशंसा करते हैं कि शामिल करें EVENT_LABEL मेटाडेटा और उपलब्ध होने पर आपके लॉगिन ईवेंट के लिए लेबल प्रदान करना। यदि आप लेबल प्रदान करते हैं, तो Amazon फ्रॉड डिटेक्टर उनका उपयोग खाता अधिग्रहण डिस्कवरी दर की स्वचालित रूप से गणना करने और इसे मॉडल प्रदर्शन मेट्रिक्स में प्रदर्शित करने के लिए करता है।

अति मॉडल में आवश्यक और वैकल्पिक चर दोनों हैं। इवेंट वेरिएबल नाम लोअरकेस अक्षरों में होने चाहिए।

निम्न तालिका अनिवार्य चरों को सारांशित करती है।

वर्ग चर प्रकार Description
आईपी ​​पते IP_ADDRESS लॉगिन इवेंट में इस्तेमाल किया गया आईपी पता
ब्राउज़र और डिवाइस USERAGENT लॉगिन ईवेंट में उपयोग किया गया ब्राउज़र, डिवाइस और OS
मान्य क्रेडेंशियल VALIDCRED इंगित करता है कि लॉगिन के लिए उपयोग किए गए क्रेडेंशियल मान्य हैं या नहीं

निम्न तालिका वैकल्पिक चर को सारांशित करती है।

वर्ग प्रकार Description
ब्राउज़र और डिवाइस FINGERPRINT ब्राउज़र या डिवाइस फ़िंगरप्रिंट के लिए विशिष्ट पहचानकर्ता
सत्र आईडी SESSION_ID प्रमाणीकरण सत्र के लिए पहचानकर्ता
लेबल EVENT_LABEL एक लेबल जो घटना को कपटपूर्ण या वैध के रूप में वर्गीकृत करता है (जैसे fraud, legit, 1या, 0)
टाइमस्टैम्प LABEL_TIMESTAMP टाइमस्टैम्प जब लेबल अंतिम बार अपडेट किया गया था; यह आवश्यक है अगर EVENT_LABEL उपलब्ध है

आप अतिरिक्त चर प्रदान कर सकते हैं। हालांकि, Amazon फ्रॉड डिटेक्टर एक अति मॉडल के प्रशिक्षण के लिए इन चरों को शामिल नहीं करेगा।

डेटासेट तैयार करना

जैसे ही आप अपना लॉगिन डेटा तैयार करना शुरू करते हैं, आपको निम्नलिखित आवश्यकताओं को पूरा करना होगा:

  • कम से कम 1,500 इकाइयां (व्यक्तिगत उपयोगकर्ता खाते) प्रदान करें, प्रत्येक में कम से कम दो संबद्ध लॉगिन ईवेंट हों
  • आपके डेटासेट में कम से कम 30 दिनों के लॉगिन इवेंट शामिल होने चाहिए

निम्नलिखित विन्यास वैकल्पिक हैं:

  • आपके डेटासेट में असफल लॉगिन ईवेंट के उदाहरण शामिल हो सकते हैं
  • आप वैकल्पिक रूप से इन असफल लॉगिन को इस रूप में लेबल कर सकते हैं fraudulent or legitimate
  • आप 6 महीने से अधिक अवधि के लॉगिन ईवेंट के साथ ऐतिहासिक डेटा तैयार कर सकते हैं और इसमें 100,000 इकाइयां शामिल कर सकते हैं

हम एक प्रदान करते हैं नमूना डेटासेट परीक्षण उद्देश्यों के लिए जिनका उपयोग आप आरंभ करने के लिए कर सकते हैं।

डेटा मान्य

अपना अति मॉडल बनाने से पहले, अमेज़ॅन फ्रॉड डिटेक्टर यह जांचता है कि मॉडल के प्रशिक्षण के लिए आपने अपने डेटासेट में शामिल किए गए मेटाडेटा और चर आकार और प्रारूप आवश्यकताओं को पूरा करते हैं या नहीं। अधिक जानकारी के लिए देखें डेटासेट सत्यापन. यदि डेटासेट सत्यापन पास नहीं करता है, तो मॉडल नहीं बनाया जाता है। सामान्य डेटासेट त्रुटियों के विवरण के लिए, देखें सामान्य घटना डेटासेट त्रुटियाँ.

इकाई, घटना प्रकार और घटना चर को परिभाषित करें

इस खंड में, हम एक इकाई, घटना प्रकार और घटना चर बनाने के चरणों के माध्यम से चलते हैं। वैकल्पिक रूप से, आप ईवेंट लेबल भी परिभाषित कर सकते हैं।

इकाई को परिभाषित करें

RSI सत्ता परिभाषित करता है कि घटना कौन कर रहा है। निकाय बनाने के लिए, निम्न चरणों को पूरा करें:

  • अमेज़ॅन फ्रॉड डिटेक्टर कंसोल पर, नेविगेशन फलक में, चुनें संस्थाओं.
  • चुनें बनाएं.
  • निकाय का नाम और वैकल्पिक विवरण दर्ज करें।
  • चुनें इकाई बनाएं.

घटना और घटना चर परिभाषित करें

एक घटना एक व्यावसायिक गतिविधि है जिसका मूल्यांकन धोखाधड़ी के जोखिम के लिए किया जाता है; यह घटना उस इकाई द्वारा की जाती है जिसे हमने अभी बनाया है। ईवेंट प्रकार Amazon फ्रॉड डिटेक्टर को भेजे गए ईवेंट के लिए संरचना को परिभाषित करता है, जिसमें ईवेंट के वेरिएबल, ईवेंट करने वाली इकाई और, यदि उपलब्ध हो, तो ईवेंट को वर्गीकृत करने वाले लेबल शामिल हैं।

कोई ईवेंट बनाने के लिए, निम्न चरणों को पूरा करें:

  • अमेज़ॅन फ्रॉड डिटेक्टर कंसोल पर, नेविगेशन फलक में, चुनें आयोजन.
  • चुनें बनाएं.
  • के लिए नाम, अपने ईवेंट प्रकार के लिए एक नाम दर्ज करें।
  • के लिए सत्ता, पिछले चरण में बनाई गई इकाई चुनें।

घटना चर परिभाषित करें

ईवेंट चर के लिए, निम्न चरणों को पूरा करें:

  • में IAM भूमिका अनुभाग बनाएं, वह विशिष्ट बकेट नाम दर्ज करें जहां आपने अपना प्रशिक्षण डेटा अपलोड किया था।
    S3 बकेट का नाम वह नाम होना चाहिए जहां आपने अपना डेटासेट अपलोड किया था। अन्यथा, आपको एक एक्सेस अस्वीकृत अपवाद त्रुटि मिलती है।
  • चुनें भूमिका बनाएं.

  • के लिए डेटा स्थान, अपने प्रशिक्षण डेटा का पथ दर्ज करें, पथ वह S3 URI है जिसे आपने पूर्वापेक्षित चरणों के दौरान कॉपी किया था, और चुनें अपलोड.

अमेज़ॅन फ्रॉड डिटेक्टर आपके प्रशिक्षण डेटासेट से हेडर निकालता है और प्रत्येक हेडर के लिए एक वैरिएबल बनाता है। वेरिएबल को सही वेरिएबल प्रकार में असाइन करना सुनिश्चित करें। मॉडल प्रशिक्षण प्रक्रिया के हिस्से के रूप में, अमेज़ॅन फ्रॉड डिटेक्टर वैरिएबल से जुड़े वेरिएबल प्रकार का उपयोग करता है ताकि वेरिएबल संवर्धन और फीचर इंजीनियरिंग का प्रदर्शन किया जा सके। चर प्रकारों के बारे में अधिक जानकारी के लिए देखें चर प्रकार.

ईवेंट लेबल परिभाषित करें (वैकल्पिक)

व्यक्तिगत घटनाओं को धोखाधड़ी या वैध के रूप में वर्गीकृत करने के लिए लेबल का उपयोग किया जाता है। इवेंट लेबल मॉडल प्रशिक्षण के लिए वैकल्पिक हैं क्योंकि अति मॉडल अनुपयोगी शिक्षण के लिए एक अभिनव दृष्टिकोण का उपयोग करता है। मॉडल वास्तविक खाता स्वामी (वैध घटनाओं) द्वारा उत्पन्न घटनाओं को अपमानजनक अभिनेताओं (विसंगत घटनाओं) द्वारा उत्पन्न घटनाओं से अलग करता है। हम अनुशंसा करते हैं कि आप शामिल करें EVENT_LABEL मेटाडेटा और यदि उपलब्ध हो तो अपने लॉगिन ईवेंट के लिए लेबल प्रदान करें। यदि आप लेबल प्रदान करते हैं, तो Amazon फ्रॉड डिटेक्टर उनका उपयोग खाता अधिग्रहण डिस्कवरी दर की स्वचालित रूप से गणना करने और इसे मॉडल प्रदर्शन मेट्रिक्स में प्रदर्शित करने के लिए करता है।

कोई ईवेंट बनाने के लिए, निम्न चरणों को पूरा करें:

  • दो लेबल परिभाषित करें (इस पोस्ट के लिए, 1 और 0)।
  • चुनें ईवेंट प्रकार बनाएँ.

ईवेंट डेटा अपलोड करें

इस सत्र में, हम मॉडल प्रशिक्षण के लिए ईवेंट डेटा को सेवा में अपलोड करने के चरणों के माध्यम से चलते हैं।

ATI मॉडल को Amazon फ्रॉड डिटेक्टर में आंतरिक रूप से संग्रहीत डेटासेट पर प्रशिक्षित किया जाता है। अमेज़ॅन फ्रॉड डिटेक्टर में इवेंट डेटा संग्रहीत करके, आप उन मॉडलों को प्रशिक्षित कर सकते हैं जो प्रदर्शन में सुधार के लिए ऑटो-कंप्यूटेड वैरिएबल का उपयोग करते हैं, मॉडल रीट्रेनिंग को आसान बनाते हैं, और मशीन लर्निंग फीडबैक लूप को बंद करने के लिए धोखाधड़ी लेबल अपडेट करते हैं। देखना संग्रहित कार्यक्रम Amazon फ्रॉड डिटेक्टर के साथ अपने ईवेंट डेटासेट को स्टोर करने के बारे में अधिक जानकारी के लिए।

अपने ईवेंट को परिभाषित करने के बाद, इस पर नेविगेट करें संग्रहित कार्यक्रम टैब। पर संग्रहित कार्यक्रम टैब पर, आप अपने डेटासेट के बारे में जानकारी देख सकते हैं, जैसे कि संग्रहीत ईवेंट की संख्या और एमबी में डेटासेट का कुल आकार। चूंकि आपने अभी-अभी यह ईवेंट प्रकार बनाया है, इसलिए अभी तक कोई संग्रहीत ईवेंट नहीं है. इस पृष्ठ पर, आप ईवेंट अंतर्ग्रहण को चालू या बंद कर सकते हैं. जब ईवेंट अंतर्ग्रहण चालू होता है, तो आप ऐतिहासिक ईवेंट डेटा को Amazon Fraud Detector पर अपलोड कर सकते हैं और स्वचालित रूप से वास्तविक समय में पूर्वानुमानों से ईवेंट डेटा संग्रहीत कर सकते हैं।

ऐतिहासिक डेटा संग्रहीत करने का सबसे आसान तरीका CSV फ़ाइल अपलोड करना और ईवेंट आयात करना है। वैकल्पिक रूप से, आप डेटा का उपयोग करके Amazon फ्रॉड डिटेक्टर में स्ट्रीम कर सकते हैं SendEvent एपीआई (हमारे देखें गिटहब भंडार नमूना नोटबुक के लिए)। ईवेंट को CSV फ़ाइल से आयात करने के लिए, निम्न चरणों को पूरा करें:

  • के अंतर्गत ईवेंट डेटा आयात करें, चुनें नया आयात.
    आपको संभवतः एक नई IAM भूमिका बनाने की आवश्यकता है। इम्पोर्ट इवेंट फीचर के लिए Amazon S3 को पढ़ने और लिखने दोनों की आवश्यकता होती है।

  • एक नई IAM भूमिका बनाएँ और इनपुट और आउटपुट फ़ाइलों के लिए S3 बकेट प्रदान करें।
    आपके द्वारा बनाई गई IAM भूमिका Amazon फ्रॉड डिटेक्टर को इनपुट फ़ाइलों को पढ़ने और आउटपुट फ़ाइलों को संग्रहीत करने के लिए इन बकेट तक पहुंच प्रदान करती है। यदि आप आउटपुट फ़ाइलों को एक अलग बकेट में संग्रहीत करने की योजना नहीं बनाते हैं, तो दोनों के लिए समान बकेट नाम दर्ज करें।
  • चुनें भूमिका बनाएं.

  • उस CSV फ़ाइल का स्थान दर्ज करें जिसमें आपका ईवेंट डेटा है। यह वह S3 URI होना चाहिए जिसे आपने पहले कॉपी किया था।
  • चुना प्रारंभ घटनाओं को आयात करना शुरू करने के लिए।

आपके द्वारा आयात किए जा रहे ईवेंट की संख्या के आधार पर आयात समय भिन्न होता है। 20,000 ईवेंट वाले डेटासेट के लिए, प्रक्रिया में लगभग 12 मिनट लगते हैं, और आपके द्वारा पृष्ठ को रीफ़्रेश करने के बाद, स्थिति बदल जाती है Completed. यदि स्थिति बदल जाती है Error, यह दिखाने के लिए कार्य का नाम चुनें कि आयात विफल क्यों हुआ।

मॉडल प्रशिक्षण शुरू करें

घटनाओं को सफलतापूर्वक आयात करने के बाद, आपके पास मॉडल प्रशिक्षण शुरू करने के लिए सभी टुकड़े हैं। एक मॉडल को प्रशिक्षित करने के लिए, निम्नलिखित चरणों को पूरा करें:

  • अमेज़ॅन फ्रॉड डिटेक्टर कंसोल पर, नेविगेशन फलक में, चुनें मॉडल.
  • चुनें मॉडल जोड़ें का चयन करें और मॉडल बनाएं.
  • के लिए मॉडल का नाम, अपने मॉडल के लिए वांछित नाम दर्ज करें
  • के लिए मॉडल प्रकार, चुनते हैं अधिग्रहण खाता अंतर्दृष्टि.
  • के लिए इवेंट प्रकार, वह ईवेंट प्रकार चुनें जिसे आपने पहले बनाया था।

  • के अंतर्गत ऐतिहासिक घटना डेटा, यदि आवश्यक हो, तो आप मॉडल को प्रशिक्षित करने के लिए ईवेंट की दिनांक सीमा निर्दिष्ट कर सकते हैं।
  • चुनें अगला.

  • इस पोस्ट के लिए, आप मॉडल में इनपुट के रूप में उपयोग किए जाने वाले चर की पहचान करके प्रशिक्षण को कॉन्फ़िगर करते हैं।
  • चरों का मूल्यांकन करने के बाद, चुनें अगला.

सभी उपलब्ध चरों को शामिल करना सबसे अच्छा अभ्यास है, भले ही आप मॉडल के लिए उनके मूल्य के बारे में अनिश्चित हों। मॉडल को प्रशिक्षित करने के बाद, अमेज़ॅन फ्रॉड डिटेक्टर मॉडल के प्रदर्शन पर प्रत्येक चर के प्रभाव की एक रैंक सूची प्रदान करता है, ताकि आप जान सकें कि भविष्य के मॉडल प्रशिक्षण में उस चर को शामिल करना है या नहीं। यदि लेबल प्रदान किए जाते हैं, तो अमेज़ॅन फ्रॉड डिटेक्टर मॉडल की खोज दर के संदर्भ में मॉडल के प्रदर्शन का मूल्यांकन और प्रदर्शन करने के लिए उनका उपयोग करता है।

यदि लेबल प्रदान नहीं किए जाते हैं, तो Amazon फ्रॉड डिटेक्टर उदाहरण या समान लॉगिन प्रयास प्रदान करने के लिए नकारात्मक नमूने का उपयोग करता है जो मॉडल को वैध और धोखाधड़ी गतिविधियों के बीच अंतर करने में मदद करता है। यह सटीक जोखिम स्कोर उत्पन्न करता है जो गलत तरीके से ध्वजांकित वैध गतिविधियों को पकड़ने के लिए मॉडल की क्षमता में सुधार करता है।

पहले दो चरणों में कॉन्फ़िगर किए गए मॉडल की समीक्षा करने के बाद, चुनें बनाएं और मॉडल को प्रशिक्षित करें।

आप कंसोल पेज में मॉडल को प्रशिक्षण स्थिति में देख सकते हैं। मॉडल को बनाने और प्रशिक्षण देने में लगभग 45 मिनट का समय लगता है। जब मॉडल ने प्रशिक्षण बंद कर दिया है, तो आप मॉडल संस्करण चुनकर मॉडल के प्रदर्शन की जांच कर सकते हैं।

मॉडल के प्रदर्शन का मूल्यांकन करें और मॉडल को तैनात करें

इस सत्र में, हम मॉडल प्रदर्शन की समीक्षा और मूल्यांकन करने के चरणों के माध्यम से चलते हैं।

अमेज़ॅन फ्रॉड डिटेक्टर आपके 15% डेटा का उपयोग करके मॉडल के प्रदर्शन को मान्य करता है जिसका उपयोग मॉडल को प्रशिक्षित करने के लिए नहीं किया गया था और प्रदर्शन मीट्रिक प्रदान करता है। आपको इन मीट्रिक और अपने व्यावसायिक उद्देश्यों पर विचार करने की आवश्यकता है ताकि एक सीमा निर्धारित की जा सके जो आपके व्यवसाय मॉडल के साथ संरेखित हो। मेट्रिक्स पर अधिक विवरण और थ्रेसहोल्ड निर्धारित करने के तरीके के लिए, देखें मॉडल प्रदर्शन मेट्रिक्स.

अति वर्गीकरण मॉडल के बजाय एक विसंगति का पता लगाने वाला मॉडल है; इसलिए, मूल्यांकन मेट्रिक्स वर्गीकरण मॉडल से भिन्न होते हैं। जब आपके अति मॉडल ने प्रशिक्षण समाप्त कर लिया है, तो आप विसंगति पृथक्करण सूचकांक (एएसआई) देख सकते हैं, जो उच्च जोखिम वाले विषम लॉगिन की पहचान करने के लिए मॉडल की क्षमता का एक समग्र उपाय है। 75% या उससे अधिक के एएसआई को अच्छा माना जाता है, 90% या अधिक को उच्च माना जाता है, और 75% से कम को गरीब माना जाता है।

सही संतुलन चुनने में सहायता के लिए, अमेज़ॅन फ्रॉड डिटेक्टर अति मॉडल प्रदर्शन का मूल्यांकन करने के लिए निम्नलिखित मीट्रिक प्रदान करता है:

  • विसंगति पृथक्करण सूचकांक (एएसआई) - उपयोगकर्ताओं के अपेक्षित व्यवहार से विषम गतिविधियों को अलग करने के लिए मॉडल की समग्र क्षमता को सारांशित करता है। बिना पृथक्करण क्षमता वाले मॉडल में न्यूनतम संभव एएसआई स्कोर 0.5 होगा। इसके विपरीत, उच्च पृथक्करण क्षमता वाले मॉडल में उच्चतम संभव एएसआई स्कोर 1.0 होगा।
  • चुनौती दर (सीआर) - स्कोर थ्रेशोल्ड लॉगिन ईवेंट के प्रतिशत को इंगित करता है जिसे मॉडल वन-टाइम पासवर्ड, मल्टी-फैक्टर ऑथेंटिकेशन, पहचान सत्यापन, जांच, आदि के रूप में चुनौती देने की सिफारिश करेगा।
  • विसंगति की खोज दर (एडीआर) - उन विसंगतियों का प्रतिशत निर्धारित करता है जो मॉडल चयनित स्कोर सीमा पर पता लगा सकता है। कम स्कोर थ्रेशोल्ड मॉडल द्वारा कैप्चर की गई विसंगतियों के प्रतिशत को बढ़ाता है। फिर भी, इसके लिए लॉगिन ईवेंट के अधिक महत्वपूर्ण प्रतिशत को चुनौती देने की भी आवश्यकता होगी, जिससे ग्राहक घर्षण में वृद्धि होगी।
  • एटीओ डिस्कवरी रेट (एटीओडीआर) - खाता समझौता घटनाओं का प्रतिशत निर्धारित करता है जो मॉडल चयनित स्कोर सीमा पर पता लगा सकता है। यह मीट्रिक केवल तभी उपलब्ध होता है जब कम से कम एक लेबल वाले एटीओ ईवेंट वाली 50 या अधिक इकाइयां अंतर्ग्रहीत डेटासेट में मौजूद हों।

निम्नलिखित उदाहरण में, हमारे पास 0.96 (उच्च) का एएसआई है, जो उपयोगकर्ताओं के सामान्य व्यवहार से विषम गतिविधियों को अलग करने की उच्च क्षमता को इंगित करता है। 500 के मॉडल स्कोर थ्रेशोल्ड का उपयोग करके एक नियम लिखकर, आप सभी लॉगिन गतिविधियों में से 6% को चुनौती देते हैं या घर्षण पैदा करते हैं, जिसमें 96% विषम गतिविधियाँ होती हैं।

एक अन्य महत्वपूर्ण मीट्रिक मॉडल चर महत्व है। परिवर्तनीय महत्व आपको इस बात की समझ देता है कि विभिन्न चर मॉडल के प्रदर्शन से कैसे संबंधित हैं। आपके पास दो प्रकार के चर हो सकते हैं: कच्चे और कुल चर। कच्चे चर वे हैं जिन्हें डेटासेट के आधार पर परिभाषित किया गया था, जबकि कुल चर कई चरों का एक संयोजन है जो समृद्ध होते हैं और एक समग्र महत्व मूल्य रखते हैं।

परिवर्तनीय महत्व के बारे में अधिक जानकारी के लिए देखें मॉडल चर महत्व.

एक चर (कच्चा या कुल) बाकी की तुलना में बहुत अधिक संख्या के साथ संकेत कर सकता है कि मॉडल ओवरफिटिंग हो सकता है। इसके विपरीत, अपेक्षाकृत कम संख्या वाले चर केवल शोर हो सकते हैं।

मॉडल के प्रदर्शन की समीक्षा करने और यह तय करने के बाद कि कौन सा मॉडल स्कोर थ्रेशोल्ड आपके व्यवसाय मॉडल के साथ संरेखित है, आप मॉडल संस्करण को परिनियोजित कर सकते हैं। उसके लिए, पर क्रियाएँ मेनू, चुनें मॉडल संस्करण परिनियोजित करें. तैनात मॉडल के साथ, हम एक डिटेक्टर एंडपॉइंट बनाते हैं और वास्तविक समय की भविष्यवाणी करते हैं।

डिटेक्टर एंडपॉइंट बनाएं और व्यावसायिक नियमों को परिभाषित करें

अमेज़ॅन फ्रॉड डिटेक्टर धोखाधड़ी की भविष्यवाणी उत्पन्न करने के लिए डिटेक्टर एंडपॉइंट का उपयोग करता है। एक डिटेक्टर में एक विशिष्ट घटना के लिए डिटेक्शन लॉजिक होता है, जैसे प्रशिक्षित मॉडल और व्यावसायिक नियम, जिसे आप धोखाधड़ी के लिए मूल्यांकन करना चाहते हैं। डिटेक्शन लॉजिक Amazon फ्रॉड डिटेक्टर को मॉडल से जुड़े डेटा की व्याख्या करने का तरीका बताने के लिए नियमों का उपयोग करता है।

डिटेक्टर बनाने के लिए, निम्नलिखित चरणों को पूरा करें:

  • अमेज़ॅन फ्रॉड डिटेक्टर कंसोल पर, नेविगेशन फलक में, चुनें डिटेक्टरों.
  • चुनें डिटेक्टर बनाएं.
  • के लिए पता लगानेवाला नाम, नाम डालें।
  • वैकल्पिक रूप से, अपने डिटेक्टर का वर्णन करें।
  • के लिए इवेंट प्रकार, पहले बनाए गए मॉडल के समान ईवेंट प्रकार चुनें।
  • चुनें अगला.

  • पर मॉडल जोड़ें (वैकल्पिक) पृष्ठ, चुनें मॉडल जोड़ें.

  • मॉडल जोड़ने के लिए, मॉडल प्रशिक्षण चरणों के दौरान आपके द्वारा प्रशिक्षित और प्रकाशित किया गया मॉडल चुनें और सक्रिय संस्करण चुनें।
  • चुनें मॉडल जोड़ें.

अगले चरण के भाग के रूप में, आप एक परिणाम को परिभाषित करने वाले व्यावसायिक नियम बनाते हैं। एक नियम एक शर्त है जो अमेज़ॅन फ्रॉड डिटेक्टर को धोखाधड़ी की भविष्यवाणी के दौरान चर मूल्यों की व्याख्या करने का तरीका बताता है। एक नियम में एक या अधिक चर, एक तर्क व्यंजक और एक या अधिक परिणाम होते हैं। एक परिणाम धोखाधड़ी की भविष्यवाणी का परिणाम होता है और यदि मूल्यांकन के दौरान नियम मेल खाता है तो उसे वापस कर दिया जाता है।

  • परिभाषित करें decline_rule as $= 950 परिणाम के साथ deny_login.
  • परिभाषित करें friction_rule as $ your_model_name _insightscore >= 855 और $ your_model_name_insightscore >= 950 परिणाम के साथ challenge_login.
  • परिभाषित करें approve_rule as $account_takeover_model_insightscore < 855 परिणाम के साथ approve_login.

परिणाम में लौटाए गए तार हैं GetEventPrediction एपीआई प्रतिक्रिया। आप एप्लिकेशन और डाउनस्ट्रीम सिस्टम को कॉल करके घटनाओं को ट्रिगर करने के लिए परिणामों का उपयोग कर सकते हैं या केवल यह पहचानने के लिए कि कौन धोखाधड़ी या वैध हो सकता है।

  • पर नियम जोड़ें पृष्ठ, चुनें अगला अपने सभी नियमों को जोड़ने के बाद।

  • में नियम निष्पादन को कॉन्फ़िगर करें अनुभाग में, अपने नियम इंजन के लिए मोड चुनें।
    अमेज़ॅन फ्रॉड डिटेक्टर नियम इंजन के दो मोड हैं: पहला मिलान या सभी मिलान। पहला मिलान मोड अनुक्रमिक नियम रन के लिए है, जो पहली शर्त पूरी होने पर परिणाम लौटाता है। अन्य मोड सभी मेल खाता है, जो सभी नियमों का मूल्यांकन करता है और सभी मिलान नियमों से परिणाम देता है। इस उदाहरण में, हम अपने डिटेक्टर के लिए पहले मिलान मोड का उपयोग करते हैं।

इस प्रक्रिया के बाद, आप अपना डिटेक्टर बनाने और कुछ परीक्षण चलाने के लिए तैयार हैं।

  • परीक्षण चलाने के लिए, अपने नए बनाए गए डिटेक्टर पर जाएं और वह डिटेक्टर संस्करण चुनें जिसका आप उपयोग करना चाहते हैं।
  • अनुरोध के अनुसार परिवर्तनीय मान प्रदान करें और चुनें चालू परीक्षण.

परीक्षण के परिणामस्वरूप, आप अपने व्यावसायिक नियमों के आधार पर जोखिम स्कोर और परिणाम प्राप्त करते हैं।

आप बाएं फलक पर जाकर और चुनकर पिछले पूर्वानुमान भी खोज सकते हैं पिछले पूर्वानुमान खोजें। भविष्यवाणी एक कपटपूर्ण घटना की समग्र संभावना में प्रत्येक चर के योगदान पर आधारित है। निम्नलिखित स्क्रीनशॉट पिछले पूर्वानुमान का एक उदाहरण है जो इनपुट चर दिखा रहा है और उन्होंने धोखाधड़ी भविष्यवाणी स्कोर को कैसे प्रभावित किया है।

वास्तविक समय की भविष्यवाणी प्राप्त करें

रीयल-टाइम पूर्वानुमान प्राप्त करने और Amazon फ्रॉड डिटेक्टर को अपने वर्कफ़्लो में एकीकृत करने के लिए, हमें डिटेक्टर एंडपॉइंट प्रकाशित करने की आवश्यकता है। निम्नलिखित चरणों को पूरा करें:

  • नव निर्मित डिटेक्टर पर जाएं और डिटेक्टर संस्करण चुनें, जो संस्करण 1 होगा।
  • पर क्रियाएँ मेनू, चुनें प्रकाशित करना.

आप प्रकाशित डिटेक्टर के साथ वास्तविक समय की भविष्यवाणी कर सकते हैं GetEventPrediction एपीआई। कॉल करने के लिए एक नमूना पायथन कोड निम्नलिखित है GetEventPrediction एपीआई:

import boto3
fraudDetector = boto3.client('frauddetector')

fraudDetector.get_event_prediction(
detectorId = 'sample_detector',
eventId = '802454d3-f7d8-482d-97e8-c4b6db9a0428',
eventTypeName = 'sample_transaction',
eventTimestamp = '2021-01-13T23:18:21Z',
entities = [{'entityType':'customer', 'entityId':'12345'}],
eventVariables = {
    'email_address' : 'johndoe@exampledomain.com',
    'ip_address' : '1.2.3.4'
}
)

निष्कर्ष

अमेज़ॅन धोखाधड़ी डिटेक्टर कई उपयोग मामलों में धोखाधड़ी की घटनाओं का पता लगाने के लिए विशिष्ट एल्गोरिदम, संवर्धन, और सुविधा परिवर्तनों के साथ विशिष्ट मॉडल पर निर्भर करता है। इस पोस्ट में, आपने सीखा कि डेटा को कैसे अंतर्ग्रहण करना है, मॉडल को प्रशिक्षित करना और परिनियोजित करना है, व्यावसायिक नियम लिखना है, और संभावित रूप से छेड़छाड़ किए गए खातों पर वास्तविक समय में धोखाधड़ी की भविष्यवाणी उत्पन्न करने के लिए एक डिटेक्टर प्रकाशित करना है।

भेंट अमेज़ॅन फ्रॉड डिटेक्टर Amazon फ्रॉड डिटेक्टर या हमारे बारे में अधिक जानने के लिए गीथहब रेपो कोड नमूने, नोटबुक और सिंथेटिक डेटासेट के लिए।


लेखक के बारे में

मार्सेल पिविडाल वर्ल्ड वाइड स्पेशलिस्ट ऑर्गनाइजेशन में सीनियर एआई सर्विसेज सॉल्यूशंस आर्किटेक्ट हैं। मार्सेल के पास फिनटेक, भुगतान प्रदाता, फार्मा और सरकारी एजेंसियों के लिए प्रौद्योगिकी के माध्यम से व्यावसायिक समस्याओं को हल करने का 20 से अधिक वर्षों का अनुभव है। उनके फोकस के वर्तमान क्षेत्र जोखिम प्रबंधन, धोखाधड़ी की रोकथाम और पहचान सत्यापन हैं।

माइक एम्स एक डेटा वैज्ञानिक से पहचान सत्यापन समाधान विशेषज्ञ बने हैं, उनके पास धोखाधड़ी, बर्बादी और दुरुपयोग से संगठनों की रक्षा के लिए मशीन लर्निंग और एआई समाधान विकसित करने का व्यापक अनुभव है। अपने खाली समय में, आप उसे अपने कुत्ते मैक्स के साथ लंबी पैदल यात्रा, माउंटेन बाइकिंग या फ्रीबी खेलते हुए पा सकते हैं।

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी

हमारे साथ चैट करें

नमस्ते! मैं आपकी कैसे मदद कर सकता हूँ?