AWS ग्लू के साथ अमेज़न पर्सनलाइज़ की स्थापना

मार्केटिंग, बिक्री या उत्पाद जैसे विभिन्न व्यावसायिक इकाइयों की जरूरतों को पूरा करने के लिए डेटा का उपयोग विभिन्न तरीकों से किया जा सकता है। इस पोस्ट में, हम एंड-यूज़र एंगेजमेंट को बेहतर बनाने के लिए व्यक्तिगत सिफारिशों को बनाने के लिए डेटा का उपयोग करने पर ध्यान केंद्रित करते हैं। अधिकांश ईकॉमर्स एप्लिकेशन ग्राहक डेटा की एक बड़ी मात्रा का उपभोग करते हैं जिसका उपयोग व्यक्तिगत सिफारिशें प्रदान करने के लिए किया जा सकता है; हालाँकि, उन मूल्यवान अंतर्दृष्टि प्रदान करने के लिए डेटा को साफ या सही प्रारूप में नहीं किया जा सकता है।

इस पोस्ट का लक्ष्य प्रदर्शित करना है कि कैसे उपयोग करना है एडब्ल्यूएस गोंद अपने JSON डेटा को एक साफ CSV प्रारूप में निकालने, बदलने और लोड करने के लिए। फिर हम आपको दिखाते हैं कि किस प्रकार एक सिफारिश इंजन द्वारा संचालित किया जाता है अमेज़न निजीकृत अपने ग्राहकों के लिए एक अनुरूप अनुभव प्रदान करने के लिए आपके उपयोगकर्ता इंटरैक्शन डेटा पर। अमेज़ॅन पर्सनलाइज़ से परिणामी आउटपुट वह अनुशंसाएँ हैं जो आप एक एपीआई से उत्पन्न कर सकते हैं।

एक सामान्य उपयोग का मामला एक ई-कॉमर्स प्लेटफॉर्म है जो उपयोगकर्ता-आइटम इंटरैक्शन डेटा एकत्र करता है और इसी तरह के उत्पादों या उत्पादों का सुझाव देता है जो ग्राहक पसंद कर सकते हैं। इस पोस्ट के अंत तक, आप अपने अशुद्ध JSON डेटा को लेने में सक्षम होंगे और उन उत्पादों के आधार पर वैयक्तिकृत अनुशंसाएँ प्रस्तुत करेंगे, जिन्हें प्रत्येक उपयोगकर्ता ने अपने अंत-उपयोगकर्ताओं के लिए बेहतर अनुभव बनाते हुए बातचीत की है। इस पोस्ट के प्रयोजनों के लिए, इसे देखें उपयोगकर्ता-आइटम-सहभागिता डेटासेट इस समाधान का निर्माण करने के लिए।

इस समाधान के संसाधन आपके AWS खाते पर खर्च कर सकते हैं। मूल्य निर्धारण की जानकारी के लिए, देखें AWS गोंद मूल्य निर्धारण और अमेज़न निजीकरण मूल्य निर्धारण.

निम्नलिखित चित्र हमारे समाधान वास्तुकला को दर्शाता है।

.. पूर्वापेक्षाएँ

इस पोस्ट के लिए, आपको निम्नलिखित की आवश्यकता है:

An अमेज़न सरल भंडारण सेवा (अमेज़न S3) बाल्टी युक्त उपयोगकर्ता-आइटम-सहभागिता डेटासेट.

एक बाल्टी बनाने के निर्देश के लिए, देखें चरण 1: अपनी पहली S3 बाल्टी बनाएँ। यह सुनिश्चित कर लें Amazon Personalize पहुंच नीति संलग्न करें.

An AWS पहचान और अभिगम प्रबंधन (IAM) के साथ AWS गोंद के लिए भूमिका AmazonS3FullAccess और AmazonPersonalizeFullAccess

ये बहुत अनुमेय नीतियां हैं; व्यवहार में यह कम से कम विशेषाधिकार का उपयोग करने के लिए सबसे अच्छा है और केवल जहां यह आवश्यक है वहां पहुंच प्रदान करें। भूमिका बनाने के निर्देश के लिए, देखें चरण 2: AWS गोंद के लिए एक IAM भूमिका बनाएँ.

AWS गोंद के साथ अपना डेटा क्रॉल करना

हम आपके डेटा का स्कीमा निर्धारित करने के लिए JWS फ़ाइल के माध्यम से क्रॉल करने के लिए AWS Glue का उपयोग करते हैं और आपकी AWS Glue Data कैटलॉग में मेटाडेटा तालिका बनाते हैं। डेटा कैटलॉग में डेटा का संदर्भ होता है जो AWS Glue में आपके ETL जॉब्स के स्रोतों और लक्ष्यों के रूप में उपयोग किया जाता है। AWS गोंद एक सर्वर रहित डेटा तैयारी सेवा है जो डेटा को निकालना, साफ़ करना, समृद्ध करना, सामान्य करना और लोड करना आसान बनाती है। यह आपके डेटा को विश्लेषण या मशीन लर्निंग (एमएल) के लिए तैयार करने में मदद करता है। इस खंड में, हम आपके JSON डेटा को Amazon Personalize के लिए कैसे तैयार करते हैं, इसके बारे में जाने के लिए CSV फ़ाइल की आवश्यकता होती है।

आपके डेटा में अलग-अलग कॉलम हो सकते हैं जिन्हें आप अमेज़ॅन पर्सनलाइज़ के ज़रिए चलाना या नहीं चाहते हैं। इस पोस्ट में, हम उपयोग करते हैं user-item-interaction.json उस डेटा को केवल एडम्स ग्लू का उपयोग करके फ़ाइल को साफ़ करें और कॉलम शामिल करें user_id, item_id, तथा timestamp, जबकि इसे CSV प्रारूप में भी रूपांतरित किया। आप अपने डेटा स्टोर तक पहुँचने, मेटाडेटा निकालने और डेटा कैटलॉग में तालिका परिभाषाएँ बनाने के लिए क्रॉलर का उपयोग कर सकते हैं। यह स्वचालित रूप से नए डेटा का पता लगाता है और स्कीमा परिभाषा को निकालता है। इससे आपको अपने डेटा की बेहतर समझ हासिल करने में मदद मिल सकती है और अपने मॉडल को प्रशिक्षित करते समय आप क्या शामिल करना चाहते हैं।

RSI user-item-interaction JSON डेटा रिकॉर्ड की एक सरणी है। क्रॉलर डेटा को एक ऑब्जेक्ट के रूप में मानता है: सिर्फ एक सरणी। हम एक बनाते हैं कस्टम क्लासिफायरियर JSON सरणी में प्रत्येक रिकॉर्ड पर आधारित स्कीमा बनाने के लिए। यदि आपका डेटा रिकॉर्ड नहीं है, तो आप इस चरण को छोड़ सकते हैं।

AWS गोंद कंसोल पर, के तहत क्रौलर, चुनें classifiers.
चुनें क्लासीफायर जोड़ें.
के लिए क्लासिफायर का नामदर्ज json_classifier.
के लिए क्लासिफायर टाइप, चुनते हैं JSON.
के लिए JSON पथ, दर्ज $[*].
चुनें बनाएं.

बनाएँ चुनें।

पर क्रॉलर्स पेज, चुनें क्रॉलर जोड़ें.
के लिए क्रॉलर नाम, दर्ज json_crawler.
के लिए कस्टम क्लासीफायर, आपके द्वारा बनाए गए क्लासिफायर को जोड़ें।

कस्टम क्लासीफायर के लिए, आपके द्वारा बनाए गए क्लासिफायर को जोड़ें।

चुनें अगला.
के लिए क्रॉलर स्रोत प्रकार, चुनें डेटा स्टोर.
बाकी सब कुछ डिफ़ॉल्ट के रूप में छोड़ दें और चुनें अगला.
के लिए डेटा स्टोर चुनें, अपने JSON डेटा फ़ाइल में अमेज़न S3 पथ दर्ज करें।
चुनें अगला.

अगला चुनें।

अनुभाग छोड़ें एक और डेटा स्टोर जोड़ें.
में एक IAM भूमिका चुनें अनुभाग चुनें मौजूदा IAM भूमिका चुनें.
के लिए IAM भूमिका(आपके द्वारा पहले बनाई गई भूमिका का चयन करें)AWSGlueServiceRole-xxx).
चुनें अगला.

अगला चुनें।

आवृत्ति के रूप में छोड़ दें रन ऑन डिमांड.
पर उत्पादन पृष्ठ, चुनें डेटाबेस जोड़ें.
के लिए डेटाबेस नाम, दर्ज json_data.
चुनें अंत.
चुनें अब इसे चलाओ.

आप अपने क्रॉलर पर भी जा सकते हैं क्रौलर पृष्ठ, अपने क्रॉलर का चयन, और चयन क्रॉलर चलाएं.

अपनी फ़ाइलों को CSV से JSON में बदलने के लिए AWS Glue का उपयोग करना

आपके क्रॉलर के चलने के पूरा होने के बाद, पर जाएं टेबल्स AWS गोंद कंसोल पर पेज। आपके क्रॉलर द्वारा बनाई गई तालिका पर नेविगेट करें। यहां आप अपने डेटा का स्कीमा देख सकते हैं। उन फ़ील्ड्स पर ध्यान दें जिन्हें आप अपने अमेज़ॅन पर्सनलाइज़ डेटा के साथ उपयोग करना चाहते हैं। इस पोस्ट के लिए, हम रखना चाहते हैं user_id, item_id, और Amazon Personalize के लिए टाइमस्टैम्प कॉलम।

इस पोस्ट के लिए, हम Amazon Personalize के लिए user_id, item_id और टाइमस्टैम्प कॉलम रखना चाहते हैं।

इस बिंदु पर, आपने अपना डेटाबेस सेट किया है। Amazon Personalize के लिए CSV फ़ाइलों की आवश्यकता होती है, इसलिए आपको JSON प्रारूप से डेटा को तीन साफ़ CSV फ़ाइलों में बदलना होगा जिसमें केवल वही डेटा शामिल होगा जो आपको Amazon Personalize में चाहिए। निम्न तालिका उन तीन CSV फ़ाइलों के उदाहरण दिखाती है जिन्हें आप Amazon Personalize में शामिल कर सकते हैं। यह नोट करना महत्वपूर्ण है बातचीत डेटा की आवश्यकता है, जबकि उपयोगकर्ता और मद डेटा मेटाडेटा वैकल्पिक है।

डेटासेट प्रकार	आवश्यक फील्ड्स	आरक्षित खोजशब्द
उपयोगकर्ता	`USER_ID` (स्ट्रिंग) 1 मेटाडेटा फ़ील्ड
आइटम	`ITEM_ID` (स्ट्रिंग) 1 मेटाडेटा फ़ील्ड	`CREATION_TIMESTAMP`(लंबा)
सहभागिता	`USER_ID` (स्ट्रिंग) `ITEM_ID` (स्ट्रिंग) `TIMESTAMP` (लंबा)	`EVENT_TYPE` (स्ट्रिंग) `IMPRESSION` (स्ट्रिंग) `EVENT_VALUE` (फ्लोट, नल)

यह सुनिश्चित करना भी महत्वपूर्ण है कि मॉडल को प्रशिक्षित करने के लिए आपके पास कम से कम 1,000 अद्वितीय संयुक्त ऐतिहासिक और घटना इंटरैक्शन हैं। कोटा के बारे में अधिक जानकारी के लिए, देखें अमेज़न निजीकरण में कोटा.

डेटा को CSV के रूप में सहेजने के लिए, आपको डेटा पर AWS Glue जॉब चलाने की आवश्यकता है। नौकरी एक व्यवसायिक तर्क है जो ईडब्ल्यूएस कार्य को एडब्ल्यूएस गोंद में करता है। नौकरी JSON से CSV में प्रारूप बदल देती है। डेटा फ़ॉर्मेटिंग के बारे में अधिक जानकारी के लिए, देखें अपने इनपुट डेटा को स्वरूपित करना.

पर एडब्ल्यूएस गोंद डैशबोर्ड, चुनें AWS गोंद स्टूडियो.

AWS गोंद स्टूडियो AWS Glue ETL जॉब बनाने, चलाने और निगरानी के लिए एक आसान-से-उपयोग वाला ग्राफिकल इंटरफ़ेस है।

चुनें नौकरियां बनाएं और प्रबंधित करें.
चुनते हैं स्रोत और लक्ष्य ग्राफ में जोड़ा गया।
के लिए स्रोत, चुनें S3.
के लिए लक्ष्य, चुनें S3.
चुनें बनाएं.

बनाएँ चुनें।

डेटा स्रोत S3 बाल्टी चुनें।
पर डेटा स्रोत गुण - S3 टैब, हमारे द्वारा पहले बनाया गया डेटाबेस और तालिका जोड़ें।

डेटा स्रोत गुणों पर - S3 टैब, डेटाबेस और तालिका जो हमने पहले बनाई थी, जोड़ें।

पर बदालना टैब, ड्रॉप करने के लिए बक्से का चयन करें user_login और location.

इस पोस्ट में, हम अपने निजीकरण एल्गोरिथ्म को चलाने के लिए किसी भी अतिरिक्त मेटाडेटा का उपयोग नहीं करते हैं।

डेटा लक्ष्य S3 बाल्टी चुनें।
पर डेटा लक्ष्य गुण - S3 टैब, के लिए का गठन, चुनें CSV.
के लिए S3 लक्ष्य स्थान, अपने लक्ष्य के लिए S3 पथ दर्ज करें।

इस पोस्ट के लिए, हम उसी बाल्टी का उपयोग करते हैं जो हमने JSON फ़ाइल के लिए उपयोग की थी।

पर नौकरी विवरण पेज, के लिए नाम, अपनी नौकरी के लिए एक नाम दर्ज करें (इस पद के लिए, json_to_csv).
के लिए IAM भूमिकापहले आपके द्वारा बनाई गई भूमिका का चयन करें।

आपको भी शामिल होना चाहिए AmazonS3FullAccess पहले की नीति।

बाकी क्षेत्रों को उनकी डिफ़ॉल्ट सेटिंग्स पर छोड़ दें।

बाकी क्षेत्रों को उनकी डिफ़ॉल्ट सेटिंग्स पर छोड़ दें।

चुनें सहेजें.
चुनें रन.

नौकरी चलने में कुछ मिनट लग सकते हैं।

अपने अमेजन S3 बकेट में, अब आपको CSV फ़ाइल देखनी चाहिए जिसका उपयोग आप अगले भाग में करते हैं।

Amazon Personalize सेट करना

इस बिंदु पर, आपके पास एक फ़ाइल प्रकार में अपना डेटा स्वरूपित है जिसे Amazon Personalize उपयोग कर सकता है। Amazon Personalize एक पूरी तरह से प्रबंधित सेवा है जो कि Amazon.com पर 20 वर्षों के अनुशंसा अनुभव का उपयोग करती है और आपको वास्तविक समय के व्यक्तिगत उत्पाद और सामग्री अनुशंसाओं और लक्षित मार्केटिंग प्रचारों को शक्ति प्रदान करके एंड-यूज़र सगाई को बेहतर बनाने में सक्षम बनाती है। इस अनुभाग में, हम व्यक्तिगत अनुभव बनाने के लिए अपने डेटा का उपयोग करने के लिए अमेज़ॅन पर्सनलाइज़ समाधान बनाने के माध्यम से जाते हैं।

अमेज़न पर निजीकृत कंसोल, के तहत नए डेटा समूह, चुनें शुरू हो.
अपने डेटासेट समूह के लिए नाम दर्ज करें।

डेटासेट समूह में डेटासेट, समाधान और ईवेंट अंतर्ग्रहण API होते हैं।

एक डेटासेट नाम दर्ज करें, और अपने डेटा के आधार पर स्कीमा विवरण दर्ज करें।

इस डेटासेट के लिए, हम निम्नलिखित स्कीमा का उपयोग करते हैं। आप अपने डेटासेट में मानों के अनुसार स्कीमा बदल सकते हैं।

{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0"
}

चुनें अगला.
Amazon S3 से डेटा आयात करने के लिए अपना डेटासेट आयात कार्य नाम दर्ज करें।

सुनिश्चित करें कि आपकी IAM सेवा की भूमिका Amazon S3 और Amazon Personalize तक है और आपकी बाल्टी सही है बाल्टी नीति.

अपने डेटा (अमेज़ॅन S3 बाल्टी पिछले अनुभाग से) के लिए पथ दर्ज करें।
पर डैशबोर्ड आपके डेटासेट समूहों के लिए पेज, के तहत डेटासेट अपलोड करें, आयात करते हैं user-item-interactions डेटा (उपयोगकर्ता डेटा और आइटम डेटा वैकल्पिक हैं, लेकिन समाधान बढ़ा सकते हैं)।

अपलोड डेटासेट के अंतर्गत, अपने डेटासेट समूहों के लिए डैशबोर्ड पृष्ठ पर,

हम एक उदाहरण शामिल करते हैं item.csv में दायर गीथहब रेपो। निम्न स्क्रीनशॉट आइटम डेटा का एक उदाहरण दिखाता है।

निम्न स्क्रीनशॉट आइटम डेटा का एक उदाहरण दिखाता है।

के अंतर्गत समाधान बनाएंके लिए, समाधान प्रशिक्षण, चुनें प्रारंभ.

एक समाधान उस डेटा का एक प्रशिक्षित मॉडल है जिसे आपने एल्गोरिथ्म या नुस्खा के साथ प्रदान किया है, जिसे आप चुनते हैं।

के लिए समाधान का नाम, दर्ज aws-user-personalization.
चुनें अगला.
समीक्षा करें और चुनें अंत.
डैशबोर्ड पर, के तहत अभियान शुरू करेंके लिए, अभियान निर्माण, चुनें प्रारंभ.

एक अभियान आपके आवेदन को आपके समाधान संस्करण से सिफारिशें प्राप्त करने की अनुमति देता है।

के लिए अभियान का नाम, नाम डालें।
आपके द्वारा बनाया गया समाधान चुनें।
चुनें अभियान बनाएं.

आपने अब अपने डेटा झील से डेटा का सफलतापूर्वक उपयोग किया है और एक सिफारिश मॉडल बनाया है जिसका उपयोग विभिन्न सिफारिशें प्राप्त करने के लिए किया जा सकता है। इस डेटासेट के साथ, आप डेटासेट में अन्य उत्पादों के साथ उपयोगकर्ता की बातचीत के आधार पर घर के बने उत्पादों के लिए व्यक्तिगत सिफारिशें प्राप्त कर सकते हैं।

अपनी सिफारिशों को प्राप्त करने के लिए Amazon Personalize का उपयोग करना

अपने समाधान का परीक्षण करने के लिए, आपके द्वारा बनाए गए अभियान पर जाएं। में परीक्षण अभियान के परिणाम अनुभाग के तहत, यूज़र आईडी, के लिए सिफारिशें प्राप्त करने के लिए एक आईडी दर्ज करें। एक रिश्तेदार स्कोर के साथ आईडी की एक सूची दिखाई देती है। आइटम आईडी की सिफारिश विशिष्ट उत्पादों के साथ सहसंबंधी है।

निम्न स्क्रीनशॉट उपयोगकर्ता आईडी के लिए एक खोज दिखाता है 1। उन्हें आइटम आईडी की सिफारिश की गई है 59, जो एक लकड़ी के चित्र फ्रेम से संबंधित है। आइटम के आगे सूचीबद्ध स्कोर आपको अपने उपयोगकर्ता को प्रत्येक आइटम की अनुमानित प्रासंगिकता देता है।

निम्न स्क्रीनशॉट उपयोगकर्ता आईडी 1 की खोज दिखाता है।

Amazon Personalize स्कोर के बारे में अधिक जानने के लिए देखें पेश है अमेजन पर्सनलाइजेशन में सिफारिश के स्कोर.

सिफारिशें उत्पन्न करने के लिए, आप कॉल कर सकते हैं GetRecommendations or GetPersonalizedRanking एपीआई का उपयोग कर AWS कमांड लाइन इंटरफ़ेस (एडब्ल्यूएस सीएलआई) या एक भाषा-विशिष्ट एसडीके। अमेज़ॅन पर्सनलाइज़ के साथ, आपकी सिफारिशें बदल सकती हैं क्योंकि उपयोगकर्ता अधिक वास्तविक समय उपयोग के मामलों के लिए आइटम पर क्लिक करता है। अधिक जानकारी के लिए देखें वास्तविक समय की सिफारिशें प्राप्त करना.

निष्कर्ष

AWS की एक विस्तृत श्रृंखला प्रदान करता है ऐ / एमएल और विश्लेषिकी ऐसी सेवाएँ जो आप अंतर्दृष्टि प्राप्त करने और बेहतर व्यावसायिक निर्णयों को निर्देशित करने के लिए उपयोग कर सकते हैं। इस पोस्ट में, आपने एक JSON डेटासेट का उपयोग किया जिसमें डेटा के अतिरिक्त कॉलम शामिल थे, और AWS Glue का उपयोग करके उस डेटा को साफ़ और रूपांतरित किया। इसके अलावा, आपने अपने ग्राहकों के लिए सिफारिशें देने के लिए Amazon Personalize का उपयोग करके एक कस्टम मॉडल बनाया।

Amazon Personalize के बारे में अधिक जानने के लिए, देखें डेवलपर गाइड। इस समाधान को आज़माएं और हमें बताएं कि क्या आपके पास कोई टिप्पणी है।

लेखक के बारे में

ज़ोइश पिथ्वाफ़ा ज़ोइश पिथावाला सैन फ्रांसिस्को से बाहर अमेज़न वेब सेवाओं पर एक स्टार्टअप सॉल्यूशन आर्किटेक्ट है। वह मुख्य रूप से स्टार्टअप ग्राहकों के साथ काम करता है ताकि उन्हें AWS पर सुरक्षित और स्केलेबल समाधान बनाने में मदद मिल सके।

सैम ट्रान सिएटल से बाहर अमेज़न वेब सेवाओं पर एक स्टार्टअप सॉल्यूशन आर्किटेक्ट है। वह अपने ग्राहकों को AWS पर अच्छी तरह से आर्किटेक्चर समाधान बनाने में मदद करने पर ध्यान केंद्रित करता है।

स्रोत: https://aws.amazon.com/blogs/machine-learning/setting-up-amazon-personalize-with-aws-glue/

जनरेटिव डेटा इंटेलिजेंस

AWS गोंद के साथ Amazon Personalize की स्थापना

.. पूर्वापेक्षाएँ

AWS गोंद के साथ अपना डेटा क्रॉल करना

अपनी फ़ाइलों को CSV से JSON में बदलने के लिए AWS Glue का उपयोग करना

Amazon Personalize सेट करना

अपनी सिफारिशों को प्राप्त करने के लिए Amazon Personalize का उपयोग करना

निष्कर्ष

लेखक के बारे में

यदि बीटीसी की कीमत इस स्तर तक पहुंचती है तो बिटकॉइन को $7.2 बिलियन का नुकसान होने का जोखिम है

लंबी अवधि के होल्डिंग के लिए शीर्ष मेम कॉइन की पसंद: डॉगकॉइन (DOGE), शीबा इनु (SHIB), और फ्यूरेवर टोकन (FURR)

नवीनतम खुफिया

क्रिप्टो को दूसरा मौका मिलता है: स्ट्राइप स्टेबलकॉइन्स के साथ सेक्टर में फिर से प्रवेश करता है

रैबिट आर1 ने विनाशकारी मानवीय पिन लॉन्च के बाद हेराल्ड 'स्टैंडआउट' एआई असिस्टेंट की समीक्षा की - डिक्रिप्ट

पीईपीई और बीओएमई मूल्य ब्रेक प्रतिरोध के रूप में मेमेकॉइन चल रहे हैं?

फ्रैंकलिन टेम्पलटन ब्लॉकचेन फंड के पीयर-टू-पीयर ट्रेडों को सक्षम बनाता है - डिक्रिप्ट

रोलअप दक्षता और सुरक्षा को बढ़ावा देने के लिए शीर्ष एथेरियम लेयर-2 नेटवर्क एवेल डीए को अपनाते हैं

बाजार में अस्थिरता के बावजूद, माइक्रोस्ट्रेटी का "बीटीसी प्रति शेयर" रिकॉर्ड स्तर के करीब पहुंच गया है

हमारे साथ चैट करें