जेफिरनेट लोगो

अमेज़ॅन ट्रांसक्राइब के साथ सुरक्षित एप्लिकेशन बनाने के लिए सर्वोत्तम अभ्यास | अमेज़न वेब सेवाएँ

दिनांक:

Amazon Transcribe एक AWS सेवा है जो ग्राहकों को बैच या स्ट्रीमिंग मोड में भाषण को टेक्स्ट में बदलने की अनुमति देती है। यह मशीन लर्निंग-संचालित स्वचालित वाक् पहचान (एएसआर), स्वचालित भाषा पहचान और पोस्ट-प्रोसेसिंग प्रौद्योगिकियों का उपयोग करता है। अमेज़ॅन ट्रांसक्राइब का उपयोग ग्राहक सेवा कॉल, मल्टीपार्टी कॉन्फ़्रेंस कॉल और ध्वनि मेल संदेशों के ट्रांसक्रिप्शन के साथ-साथ रिकॉर्ड किए गए और लाइव वीडियो के लिए उपशीर्षक पीढ़ी के लिए किया जा सकता है, उदाहरण के लिए, कुछ उदाहरणों के नाम पर। इस ब्लॉग पोस्ट में, आप सीखेंगे कि अमेज़ॅन ट्रांसक्राइब क्षमताओं के साथ अपने एप्लिकेशन को इस तरह से कैसे सशक्त बनाया जाए जो आपकी सुरक्षा आवश्यकताओं को पूरा करे।

कुछ ग्राहक Amazon Transcribe को अपने व्यवसाय के लिए गोपनीय और स्वामित्व वाला डेटा सौंपते हैं। अन्य मामलों में, अमेज़ॅन ट्रांसक्राइब द्वारा संसाधित ऑडियो सामग्री में संवेदनशील डेटा हो सकता है जिसे स्थानीय कानूनों और विनियमों के अनुपालन के लिए संरक्षित करने की आवश्यकता होती है। ऐसी जानकारी के उदाहरण व्यक्तिगत पहचान योग्य जानकारी (पीआईआई), व्यक्तिगत स्वास्थ्य जानकारी (पीएचआई), और भुगतान कार्ड उद्योग (पीसीआई) डेटा हैं। ब्लॉग के निम्नलिखित अनुभागों में, हम अमेज़ॅन ट्रांस्क्राइब द्वारा ट्रांज़िट और आराम दोनों में ग्राहक डेटा की सुरक्षा के लिए विभिन्न तंत्रों को कवर करते हैं। हम अमेज़ॅन ट्रांसक्राइब के साथ एप्लिकेशन बनाने के लिए निम्नलिखित सात सुरक्षा सर्वोत्तम प्रथाओं को साझा करते हैं जो आपकी सुरक्षा और अनुपालन आवश्यकताओं को पूरा करते हैं:

  1. Amazon Transcribe के साथ डेटा सुरक्षा का उपयोग करें
  2. निजी नेटवर्क पथ पर संचार करें
  3. यदि आवश्यक हो तो संवेदनशील डेटा को संशोधित करें
  4. उन एप्लिकेशन और AWS सेवाओं के लिए IAM भूमिकाओं का उपयोग करें जिनके लिए Amazon Transcribe एक्सेस की आवश्यकता होती है
  5. टैग-आधारित अभिगम नियंत्रण का उपयोग करें
  6. AWS निगरानी उपकरण का उपयोग करें
  7. AWS कॉन्फ़िगरेशन सक्षम करें

निम्नलिखित सर्वोत्तम प्रथाएँ सामान्य दिशानिर्देश हैं और पूर्ण सुरक्षा समाधान का प्रतिनिधित्व नहीं करती हैं। चूँकि ये सर्वोत्तम प्रथाएँ आपके पर्यावरण के लिए उपयुक्त या पर्याप्त नहीं हो सकती हैं, इसलिए इन्हें नुस्खे के बजाय सहायक विचार के रूप में उपयोग करें।

सर्वोत्तम अभ्यास 1 - अमेज़ॅन ट्रांसक्राइब के साथ डेटा सुरक्षा का उपयोग करें

Amazon Transcribe इसके अनुरूप है AWS साझा जिम्मेदारी मॉडल, जो क्लाउड की सुरक्षा के लिए AWS जिम्मेदारी को क्लाउड में सुरक्षा के लिए ग्राहक की जिम्मेदारी से अलग करता है।

AWS वैश्विक बुनियादी ढांचे की सुरक्षा के लिए जिम्मेदार है जो सभी AWS क्लाउड को चलाता है। ग्राहक के रूप में, आप इस बुनियादी ढांचे पर होस्ट की गई अपनी सामग्री पर नियंत्रण बनाए रखने के लिए जिम्मेदार हैं। इस सामग्री में आपके द्वारा उपयोग की जाने वाली AWS सेवाओं के लिए सुरक्षा कॉन्फ़िगरेशन और प्रबंधन कार्य शामिल हैं। डेटा गोपनीयता के बारे में अधिक जानकारी के लिए, देखें डेटा गोपनीयता अक्सर पूछे जाने वाले प्रश्न.

पारगमन में डेटा की सुरक्षा करना

डेटा एन्क्रिप्शन का उपयोग यह सुनिश्चित करने के लिए किया जाता है कि आपके एप्लिकेशन और अमेज़ॅन ट्रांसक्राइब के बीच डेटा संचार गोपनीय रहे। मजबूत क्रिप्टोग्राफ़िक एल्गोरिदम का उपयोग संचारित होने के दौरान डेटा की सुरक्षा करता है।

Amazon Transcribe दो मोड में से एक में काम कर सकता है:

  • स्ट्रीमिंग ट्रांसक्रिप्शन वास्तविक समय में मीडिया स्ट्रीम प्रतिलेखन की अनुमति दें
  • बैच प्रतिलेखन कार्य एसिंक्रोनस नौकरियों का उपयोग करके ऑडियो फ़ाइलों के ट्रांसक्रिप्शन की अनुमति दें।

स्ट्रीमिंग ट्रांसक्रिप्शन मोड में, क्लाइंट एप्लिकेशन HTTP/2 या WebSockets पर एक द्विदिशीय स्ट्रीमिंग कनेक्शन खोलते हैं। एक एप्लिकेशन अमेज़ॅन ट्रांसक्राइब को एक ऑडियो स्ट्रीम भेजता है, और सेवा वास्तविक समय में टेक्स्ट की स्ट्रीम के साथ प्रतिक्रिया करती है। HTTP/2 और WebSockets स्ट्रीमिंग कनेक्शन दोनों ट्रांसपोर्ट लेयर सिक्योरिटी (TLS) पर स्थापित किए गए हैं, जो एक व्यापक रूप से स्वीकृत क्रिप्टोग्राफ़िक प्रोटोकॉल है। टीएलएस एडब्ल्यूएस प्रमाणपत्रों का उपयोग करके पारगमन में डेटा का प्रमाणीकरण और एन्क्रिप्शन प्रदान करता है। हम टीएलएस 1.2 या बाद के संस्करण का उपयोग करने की सलाह देते हैं।

बैच ट्रांसक्रिप्शन मोड में, सबसे पहले एक ऑडियो फ़ाइल को डालना होगा अमेज़न सरल भंडारण सेवा (अमेज़न S3) बाल्टी। फिर इस फ़ाइल के S3 URI को संदर्भित करने वाला एक बैच ट्रांसक्रिप्शन कार्य Amazon ट्रांसक्राइब में बनाया जाता है। बैच मोड में अमेज़ॅन ट्रांसक्राइब और अमेज़ॅन एस3 दोनों ट्रांज़िट में डेटा की सुरक्षा के लिए टीएलएस पर HTTP/1.1 का उपयोग करते हैं।

HTTP और WebSockets पर Amazon Transcribe के सभी अनुरोधों को इसका उपयोग करके प्रमाणित किया जाना चाहिए एडब्ल्यूएस हस्ताक्षर संस्करण 4. अमेज़ॅन S4 पर भी HTTP अनुरोधों को प्रमाणित करने के लिए सिग्नेचर संस्करण 3 का उपयोग करने की अनुशंसा की जाती है, हालांकि प्रमाणीकरण पुराने के साथ है हस्ताक्षर संस्करण 2 कुछ AWS क्षेत्रों में भी संभव है। AWS सेवाओं के लिए API अनुरोधों पर हस्ताक्षर करने के लिए एप्लिकेशन के पास वैध क्रेडेंशियल होना चाहिए।

आराम से डेटा की सुरक्षा करना

बैच मोड में अमेज़ॅन ट्रांसक्राइब इनपुट ऑडियो फ़ाइल और आउटपुट ट्रांसक्रिप्शन फ़ाइल दोनों को स्टोर करने के लिए S3 बकेट का उपयोग करता है। ग्राहक इनपुट ऑडियो फ़ाइल को संग्रहीत करने के लिए S3 बकेट का उपयोग करते हैं, और इस बकेट पर एन्क्रिप्शन सक्षम करने की अत्यधिक अनुशंसा की जाती है। Amazon Transcribe निम्नलिखित S3 एन्क्रिप्शन विधियों का समर्थन करता है:

दोनों विधियां ग्राहक डेटा को एन्क्रिप्ट करती हैं क्योंकि यह डिस्क पर लिखा जाता है और जब आप इसे उपलब्ध सबसे मजबूत ब्लॉक साइफर में से एक का उपयोग करके एक्सेस करते हैं तो इसे डिक्रिप्ट करते हैं: 256-बिट उन्नत एन्क्रिप्शन मानक (एईएस -256) जीसीएम। एसएसई-एस 3 का उपयोग करते समय, एन्क्रिप्शन कुंजी प्रबंधित की जाती हैं और Amazon S3 सेवा द्वारा नियमित रूप से घुमाया जाता है। अतिरिक्त सुरक्षा और अनुपालन के लिए, SSE-KMS ग्राहकों को एन्क्रिप्शन कुंजी पर नियंत्रण प्रदान करता है AWS प्रमुख प्रबंधन सेवा (एडब्ल्यूएस केएमएस)। AWS KMS अतिरिक्त एक्सेस नियंत्रण देता है क्योंकि SSE-KMS के साथ कॉन्फ़िगर किए गए S3 बकेट में ऑब्जेक्ट को एन्क्रिप्ट और डिक्रिप्ट करने के लिए आपके पास उपयुक्त KMS कुंजियों का उपयोग करने की अनुमति होनी चाहिए। इसके अलावा, एसएसई-केएमएस ग्राहकों को एक ऑडिट ट्रेल क्षमता प्रदान करता है जो यह रिकॉर्ड रखता है कि आपकी केएमएस कुंजियों का उपयोग किसने और कब किया।

आउटपुट ट्रांसक्रिप्शन को उसी या अलग ग्राहक-स्वामित्व वाली S3 बकेट में संग्रहीत किया जा सकता है। इस मामले में, वही SSE-S3 और SSE-KMS एन्क्रिप्शन विकल्प लागू होते हैं। बैच मोड में अमेज़ॅन ट्रांसक्राइब आउटपुट के लिए एक अन्य विकल्प सेवा-प्रबंधित S3 बकेट का उपयोग करना है। फिर आउटपुट डेटा को अमेज़ॅन ट्रांसक्राइब सेवा द्वारा प्रबंधित एक सुरक्षित S3 बकेट में डाल दिया जाता है, और आपको एक अस्थायी यूआरआई प्रदान किया जाता है जिसका उपयोग आपकी ट्रांसक्रिप्ट डाउनलोड करने के लिए किया जा सकता है।

Amazon Transcribe एन्क्रिप्टेड का उपयोग करता है अमेज़ॅन इलास्टिक ब्लॉक स्टोर (अमेज़ॅन ईबीएस) मीडिया प्रोसेसिंग के दौरान ग्राहक डेटा को अस्थायी रूप से संग्रहीत करने के लिए वॉल्यूम। पूर्ण और विफलता दोनों मामलों के लिए ग्राहक डेटा साफ़ किया जाता है।

सर्वोत्तम अभ्यास 2 - निजी नेटवर्क पथ पर संचार करें

कई ग्राहक इंटरनेट पर अमेज़ॅन ट्रांसक्राइब के साथ सुरक्षित रूप से संचार करने के लिए ट्रांज़िट में एन्क्रिप्शन पर भरोसा करते हैं। हालाँकि, कुछ अनुप्रयोगों के लिए, पारगमन में डेटा एन्क्रिप्शन सुरक्षा आवश्यकताओं को पूरा करने के लिए पर्याप्त नहीं हो सकता है। कुछ मामलों में, इंटरनेट जैसे सार्वजनिक नेटवर्क पर जाने के लिए डेटा की आवश्यकता नहीं होती है। साथ ही, एप्लिकेशन को ऐसे निजी वातावरण में तैनात करने की भी आवश्यकता हो सकती है जो इंटरनेट से कनेक्ट न हो। इन आवश्यकताओं को पूरा करने के लिए, उपयोग करें इंटरफ़ेस वीपीसी समापन बिंदु द्वारा संचालित एडब्ल्यूएस प्राइवेटलिंक.

निम्नलिखित वास्तुशिल्प आरेख एक उपयोग के मामले को दर्शाता है जहां एक एप्लिकेशन को तैनात किया गया है अमेज़ॅन EC2. एप्लिकेशन चलाने वाले EC2 इंस्टेंस के पास इंटरनेट तक पहुंच नहीं है और इंटरफ़ेस VPC एंडपॉइंट के माध्यम से Amazon Transcribe और Amazon S3 के साथ संचार कर रहा है।

VPC के अंदर एक EC2 इंस्टेंस इंटरफ़ेस VPC एंडपॉइंट के माध्यम से उसी क्षेत्र में Amazon Transcribe और Amazon S3 सेवाओं के साथ संचार कर रहा है।

कुछ परिदृश्यों में, अमेज़ॅन ट्रांसक्राइब के साथ संचार करने वाले एप्लिकेशन को ऑन-प्रिमाइसेस डेटा सेंटर में तैनात किया जा सकता है। अतिरिक्त सुरक्षा या अनुपालन आवश्यकताएं हो सकती हैं जो यह अनिवार्य करती हैं कि अमेज़ॅन ट्रांसक्राइब के साथ आदान-प्रदान किए गए डेटा को इंटरनेट जैसे सार्वजनिक नेटवर्क पर स्थानांतरित नहीं किया जाना चाहिए। इस मामले में, निजी कनेक्टिविटी के माध्यम से एडब्ल्यूएस डायरेक्ट कनेक्ट इस्तेमाल किया जा सकता है। निम्नलिखित आरेख एक आर्किटेक्चर दिखाता है जो ऑन-प्रिमाइसेस एप्लिकेशन को इंटरनेट से किसी भी कनेक्टिविटी के बिना अमेज़ॅन ट्रांसक्राइब के साथ संचार करने की अनुमति देता है।

एप्लिकेशन सर्वर के साथ एक कॉर्पोरेट डेटा सेंटर AWS डायरेक्ट कनेक्ट के माध्यम से AWS क्लाउड से जुड़ा है। ऑन-प्रिमाइसेस एप्लिकेशन सर्वर AWS डायरेक्ट कनेक्ट और फिर इंटरफ़ेस VPC एंडपॉइंट के माध्यम से Amazon Transcribe और Amazon S3 सेवाओं के साथ संचार कर रहा है।

सर्वोत्तम अभ्यास 3 - यदि आवश्यक हो तो संवेदनशील डेटा को संशोधित करें

कुछ उपयोग मामलों और नियामक परिवेशों में प्रतिलेखों और ऑडियो फ़ाइलों से संवेदनशील डेटा को हटाने की आवश्यकता हो सकती है। अमेज़ॅन ट्रांसक्राइब व्यक्तिगत रूप से पहचान योग्य जानकारी (पीआईआई) जैसे नाम, पते, सामाजिक सुरक्षा नंबर आदि को पहचानने और संशोधित करने का समर्थन करता है। इस क्षमता का उपयोग ग्राहकों को क्रेडिट या डेबिट कार्ड नंबर, समाप्ति तिथि और तीन अंकों वाले कार्ड सत्यापन कोड (सीवीवी) जैसे पीआईआई को संशोधित करके भुगतान कार्ड उद्योग (पीसीआई) अनुपालन प्राप्त करने में सक्षम बनाने के लिए किया जा सकता है। संशोधित जानकारी वाले प्रतिलेखों में पीआईआई को वर्गाकार कोष्ठक में प्लेसहोल्डर से बदल दिया जाएगा, जो दर्शाता है कि किस प्रकार की पीआईआई को संपादित किया गया था। स्ट्रीमिंग ट्रांस्क्रिप्शन केवल पीआईआई की पहचान करने और बिना संशोधन के इसे लेबल करने की अतिरिक्त क्षमता का समर्थन करता है। अमेज़ॅन ट्रांसक्राइब द्वारा संशोधित पीआईआई के प्रकार बैच और स्ट्रीमिंग ट्रांस्क्रिप्शन के बीच भिन्न होते हैं। को देखें आपके बैच की नौकरी में पीआईआई को संशोधित करना और रीयल-टाइम स्ट्रीम में PII को संशोधित करना या उसकी पहचान करना अधिक जानकारी के लिए.

विशेष Amazon ट्रांसक्राइब कॉल एनालिटिक्स एपीआई में टेक्स्ट ट्रांसक्रिप्ट और ऑडियो फाइलों दोनों में पीआईआई को संशोधित करने की अंतर्निहित क्षमता होती है। यह एपीआई ग्राहक सेवा और बिक्री कॉल को समझने के लिए विशेष रूप से प्रशिक्षित विशेष भाषण-से-पाठ और प्राकृतिक भाषा प्रसंस्करण (एनएलपी) मॉडल का उपयोग करता है। अन्य उपयोग के मामलों के लिए, आप इसका उपयोग कर सकते हैं यह समाधान अमेज़ॅन ट्रांसक्राइब के साथ ऑडियो फ़ाइलों से पीआईआई को संशोधित करने के लिए।

अतिरिक्त अमेज़ॅन ट्रांसक्राइब सुरक्षा सर्वोत्तम अभ्यास

सर्वोत्तम अभ्यास 4 - उपयोग IAM भूमिकाएं उन एप्लिकेशन और AWS सेवाओं के लिए जिनके लिए Amazon Transcribe एक्सेस की आवश्यकता होती है। जब आप किसी भूमिका का उपयोग करते हैं, तो आपको EC2 इंस्टेंस या AWS सेवा में दीर्घकालिक क्रेडेंशियल, जैसे पासवर्ड या एक्सेस कुंजियाँ वितरित करने की आवश्यकता नहीं होती है। IAM भूमिकाएँ अस्थायी अनुमतियाँ प्रदान कर सकती हैं जिनका उपयोग एप्लिकेशन AWS संसाधनों के लिए अनुरोध करते समय कर सकते हैं।

सर्वोत्तम अभ्यास 5 - उपयोग टैग-आधारित अभिगम नियंत्रण. आप अपने AWS खातों में पहुंच को नियंत्रित करने के लिए टैग का उपयोग कर सकते हैं। अमेज़ॅन ट्रांसक्राइब में, टैग को ट्रांसक्रिप्शन नौकरियों, कस्टम शब्दावली, कस्टम शब्दावली फ़िल्टर और कस्टम भाषा मॉडल में जोड़ा जा सकता है।

सर्वोत्तम अभ्यास 6 - AWS निगरानी उपकरण का उपयोग करें. Amazon Transcribe और आपके AWS समाधानों की विश्वसनीयता, सुरक्षा, उपलब्धता और प्रदर्शन को बनाए रखने के लिए निगरानी एक महत्वपूर्ण हिस्सा है। तुम कर सकते हो AWS CloudTrail का उपयोग करके Amazon Transcribe की निगरानी करें और अमेज़ॅन क्लाउडवॉच.

सर्वोत्तम अभ्यास 7 - सक्षम एडब्ल्यूएस कॉन्फिग. AWS कॉन्फ़िगरेशन आपको अपने AWS संसाधनों के कॉन्फ़िगरेशन का आकलन, ऑडिट और मूल्यांकन करने में सक्षम बनाता है। AWS कॉन्फ़िगरेशन का उपयोग करके, आप AWS संसाधनों के बीच कॉन्फ़िगरेशन और संबंधों में परिवर्तनों की समीक्षा कर सकते हैं, विस्तृत संसाधन कॉन्फ़िगरेशन इतिहास की जांच कर सकते हैं, और अपने आंतरिक दिशानिर्देशों में निर्दिष्ट कॉन्फ़िगरेशन के विरुद्ध अपने समग्र अनुपालन का निर्धारण कर सकते हैं। यह आपको अनुपालन ऑडिटिंग, सुरक्षा विश्लेषण, परिवर्तन प्रबंधन और परिचालन समस्या निवारण को सरल बनाने में मदद कर सकता है।

अमेज़ॅन ट्रांसक्राइब के लिए अनुपालन सत्यापन

आपके द्वारा AWS पर बनाए गए एप्लिकेशन SOC, PCI, FedRAMP और HIPAA जैसे अनुपालन कार्यक्रमों के अधीन हो सकते हैं। AWS विभिन्न कार्यक्रमों के अनुपालन के लिए अपनी सेवाओं का मूल्यांकन करने के लिए तीसरे पक्ष के लेखा परीक्षकों का उपयोग करता है। एडब्ल्यूएस विरूपण साक्ष्य आप करने के लिए अनुमति देता है तृतीय-पक्ष ऑडिट रिपोर्ट डाउनलोड करें.

यह पता लगाने के लिए कि क्या AWS सेवा विशिष्ट अनुपालन कार्यक्रमों के दायरे में है, देखें अनुपालन कार्यक्रम के दायरे में AWS सेवाएँ. अतिरिक्त जानकारी और संसाधनों के लिए जो AWS ग्राहकों को अनुपालन में मदद करने के लिए प्रदान करता है, देखें अमेज़ॅन ट्रांसक्राइब के लिए अनुपालन सत्यापन और AWS अनुपालन संसाधन.

निष्कर्ष

इस पोस्ट में, आपने अमेज़ॅन ट्रांसक्राइब के साथ सुरक्षित एप्लिकेशन बनाने के लिए उपलब्ध विभिन्न सुरक्षा तंत्रों, सर्वोत्तम प्रथाओं और वास्तुशिल्प पैटर्न के बारे में सीखा है। आप मजबूत एन्क्रिप्शन के साथ पारगमन और विश्राम दोनों में अपने संवेदनशील डेटा की सुरक्षा कर सकते हैं। यदि आप इसे संसाधित और संग्रहीत नहीं करना चाहते हैं तो पीआईआई रिडक्शन का उपयोग आपकी प्रतिलेखों से व्यक्तिगत जानकारी को हटाने में सक्षम बनाने के लिए किया जा सकता है। वीपीसी एंडपॉइंट और डायरेक्ट कनेक्ट आपको अपने एप्लिकेशन और अमेज़ॅन ट्रांसक्राइब सेवा के बीच निजी कनेक्टिविटी स्थापित करने की अनुमति देते हैं। हमने संदर्भ भी प्रदान किए हैं जो एसओसी, पीसीआई, फेडआरएएमपी और एचआईपीएए जैसे कार्यक्रमों के साथ अमेज़ॅन ट्रांसक्राइब का उपयोग करके आपके एप्लिकेशन के अनुपालन को मान्य करने में आपकी सहायता करेंगे।

अगले चरण के रूप में, जाँच करें अमेज़ॅन ट्रांसक्राइब के साथ शुरुआत करना सेवा का उपयोग शीघ्रता से प्रारंभ करने के लिए. को देखें अमेज़ॅन ट्रांसक्राइब दस्तावेज़ सेवा विवरण में गहराई से जाने के लिए। और अनुसरण करो AWS मशीन लर्निंग ब्लॉग पर Amazon ट्रांसक्राइब अमेज़ॅन ट्रांसक्राइब के लिए नई क्षमताओं और उपयोग के मामलों से अपडेट रहने के लिए।


लेखक के बारे में

AWS में सॉल्यूशंस आर्किटेक्ट एलेक्स बुलैटकिन की पोर्ट्रेट छवि

एलेक्स बुलाटकिन AWS में सॉल्यूशन आर्किटेक्ट हैं। उन्हें संचार सेवा प्रदाताओं को AWS में नवीन समाधान बनाने में मदद करने में आनंद आता है जो दूरसंचार उद्योग को फिर से परिभाषित कर रहे हैं। उन्हें अपने अनुप्रयोगों में AWS AI सेवाओं की शक्ति लाने के लिए ग्राहकों के साथ काम करने का शौक है। एलेक्स डेनवर महानगरीय क्षेत्र में रहता है और उसे पैदल यात्रा, स्की और स्नोबोर्ड करना पसंद है।

स्पॉट_आईएमजी

नवीनतम खुफिया

स्पॉट_आईएमजी