شعار زيفيرنت

فتح البيانات عبر الحدود التنظيمية باستخدام Amazon DataZone - متوفر الآن بشكل عام | خدمات الويب الأمازون

التاريخ:

يسعدنا أن نعلن عن التوفر العام لـ أمازون داتا زون. تتيح Amazon DataZone للعملاء اكتشاف البيانات والوصول إليها ومشاركتها وإدارتها على نطاق واسع عبر الحدود التنظيمية، مما يقلل العبء غير المتمايز المتمثل في جعل البيانات وأدوات التحليلات في متناول الجميع في المؤسسة. باستخدام Amazon DataZone، يمكن لمستخدمي البيانات مثل مهندسي البيانات وعلماء البيانات ومحللي البيانات مشاركة البيانات والوصول إليها عبر حسابات AWS باستخدام بوابة بيانات موحدة، مما يسمح لهم باكتشاف هذه البيانات واستخدامها والتعاون فيها عبر فرقهم ومؤسساتهم. بالإضافة إلى ذلك، يمكن لمالكي البيانات ومشرفي البيانات تسهيل اكتشاف البيانات عن طريق إضافة سياق الأعمال إلى البيانات مع موازنة إدارة الوصول إلى البيانات عبر وسائل محددة مسبقًا سير عمل الموافقة في واجهة المستخدم.

في منشور المدونة هذا، نشارك ما سمعناه من عملائنا والذي قادنا إلى إنشاء Amazon DataZone ومناقشة حالات استخدام العملاء المحددة والاقتباسات من العملاء الذين جربوا Amazon DataZone أثناء المعاينة العامة لدينا. ثم نشرح فوائد Amazon DataZone ونوجهك عبر الميزات الرئيسية.

نقاط الألم الشائعة لإدارة البيانات وحوكمتها:

  1. اكتشاف البيانات، وخاصة البيانات الموزعة عبر الحسابات والمناطق – يعد العثور على البيانات المراد استخدامها للتحليل أمرًا صعبًا لأن المؤسسات غالبًا ما تمتلك بيتابايت من البيانات المنتشرة عبر عشرات أو حتى آلاف مصادر البيانات.
  2. الوصول إلى البيانات – يعد التحكم في الوصول إلى البيانات أمرًا صعبًا، ويتم إدارته بشكل مختلف عبر المؤسسات، وغالبًا ما يتطلب موافقات يدوية يمكن أن تستغرق وقتًا طويلاً ويصعب تحديثها، مما يؤدي إلى عدم تمكن المحللين من الوصول إلى البيانات التي يحتاجون إليها.
  3. الوصول إلى الأدوات - يرغب مستخدمو البيانات في استخدام أدوات مختلفة مع نفس البيانات المحكومة. يعد هذا أمرًا صعبًا لأن الوصول إلى البيانات تتم إدارته بشكل مختلف بواسطة كل أداة من الأدوات.
  4. التعاون: – غالبًا ما يمتلك المحللون وعلماء البيانات ومهندسو البيانات خطوات مختلفة ضمن رحلة التحليلات الشاملة ولكن ليس لديهم طريقة بسيطة للتعاون في نفس البيانات المُدارة، باستخدام الأدوات التي يختارونها.
  5. مراقبة البيانات – يتم إخفاء بنيات التحكم في البيانات داخل الأدوات الفردية ويتم إدارتها بشكل مختلف بواسطة فرق مختلفة، مما يمنع المؤسسات من إمكانية التتبع بشأن من يصل إلى ماذا ولماذا.

ثلاث فوائد أساسية لـ Amazon DataZone

تتيح Amazon DataZone للعملاء اكتشاف البيانات ومشاركتها وإدارتها على نطاق واسع عبر الحدود التنظيمية.

  • إدارة الوصول إلى البيانات عبر الحدود التنظيمية. ساعد في ضمان وصول المستخدم المناسب إلى البيانات الصحيحة للغرض الصحيح — بما يتوافق مع لوائح الأمان الخاصة بمؤسستك — دون الاعتماد على بيانات الاعتماد الفردية. توفير الشفافية بشأن استخدام أصول البيانات والموافقة على اشتراكات البيانات من خلال سير عمل محكوم. مراقبة أصول البيانات عبر المشاريع من خلال إمكانيات تدقيق الاستخدام.
  • قم بتوصيل الأشخاص المعنيين بالبيانات من خلال البيانات والأدوات المشتركة لتعزيز رؤى الأعمال. قم بزيادة كفاءة فريق عملك من خلال التعاون بسلاسة عبر الفرق وتوفير وصول الخدمة الذاتية إلى أدوات البيانات والتحليلات. استخدم مصطلحات الأعمال للبحث عن البيانات المفهرسة ومشاركتها والوصول إليها، مما يتيح الوصول إلى البيانات لجميع المستخدمين الذين تم تكوينهم لمعرفة المزيد حول البيانات التي يريدون استخدامها مع قاموس مصطلحات الأعمال.
  • أتمتة اكتشاف البيانات وفهرستها باستخدام التعلم الآلي (ML). تقليل الوقت اللازم لإدخال سمات البيانات يدويًا في كتالوج بيانات الأعمال وتقليل حدوث الأخطاء. تعمل البيانات الأكثر ثراءً في كتالوج البيانات على تحسين تجربة البحث أيضًا. قلل وقتك في البحث عن البيانات واستخدامها من أسابيع إلى أيام.

فيما يلي المزايا الأساسية التي توفرها Amazon DataZone لعملائها.

الشكل 1: فوائد Amazon DataZone

الشكل 1: فوائد Amazon DataZone

لتوفير فوائد هذه الأطروحات، دعونا نرى ما هي القدرات المضمنة في هذه الخدمة.

الشكل 2: إمكانيات Amazon DataZone

الشكل 2: إمكانيات Amazon DataZone

توفر Amazon DataZone الإمكانيات التفصيلية التالية.

  1. المجالات التي تعتمد على الأعمال - يمثل مجال DataZone الحدود المميزة لخط العمل (LOB) أو منطقة العمل داخل مؤسسة يمكنها إدارة بياناتها الخاصة، بما في ذلك أصول البيانات الخاصة بها، وتعريفها الخاص للبيانات أو مصطلحات الأعمال، وقد يكون لها خاصيتها المعايير الحاكمة. النطاق هو نقطة البداية لرحلة العميل مع Amazon DataZone. عندما تبدأ في استخدام DataZone لأول مرة، فإنك تقوم بإنشاء مجال، وجميع المكونات الأساسية، مثل كتالوج بيانات الأعمال والمشاريع والبيئات، التي ستكون موجودة داخل المجال.
    1. مجال Amazon DataZone يحتوي على كتالوج بيانات الأعمال المرتبطة للبحث والاكتشاف، مجموعة من تعريفات البيانات الوصفية لتزيين أصول البيانات المستخدمة لأغراض الاكتشاف، ومشاريع البيانات مع التحليلات المتكاملة وأدوات التعلم الآلي للمستخدمين والمجموعات لاستهلاك أصول البيانات ونشرها.
    2. يمكن لمجال Amazon DataZone تمتد عبر حسابات AWS متعددة عن طريق ربط وسحب بيانات بحيرة البيانات أو مستودع البيانات في هذه الحسابات (على سبيل المثال، كتالوج بيانات AWS Glue) لتشكيل شبكة بيانات أو إنشاء وتشغيل المشاريع والبيئات في هذه الحسابات عبر مناطق AWS المدعومة.
    3. توفر نطاقات Amazon DataZone إمكانات إدارة الوصول إلى موارد AWS (AWS RAM) إلى مشاركة الموارد بشكل آمن عبر الحسابات.
    4. بعد إنشاء مجال Amazon DataZone، يوفر المجال تطبيق ويب يستند إلى المستعرض حيث يمكن لمستخدمي المؤسسة الذين تم تكوينهم الانتقال إلى كتالوج البيانات واكتشافها وإدارتها ومشاركتها وتحليلها في خدمة ذاتية موضة. تدعم بوابة البيانات موفري الهوية من خلال مركز هوية AWS IAM (خليفة لتسجيل الدخول الموحد لـ AWS) و إدارة الهوية والوصول (IAM) AWS المبادئ الأساسية للمصادقة.
    5. على سبيل المثال، يمكن لفريق التسويق إنشاء نطاق باسم "التسويق" ويكون له الملكية الكاملة عليه. وبالمثل، يمكن لفريق المبيعات إنشاء نطاق باسم "المبيعات" ويكون له الملكية الكاملة عليه. عندما تريد المبيعات مشاركة البيانات مع التسويق، يمكن لفريق التسويق منح حق الوصول إلى حساب مبيعات من خلال ربط هذا الحساب بمجال التسويق، ويمكن لمستخدم المبيعات استخدام رابط بوابة Amazon DataZone الخاص بمجال التسويق لمشاركة بياناته مع فريق التسويق.
  2. كتالوج بيانات الأعمال على مستوى المنظمة - تستطيع فعل البيانات مرئية في سياق العمل للمستخدمين للعثور على البيانات وفهمها بسرعة وكفاءة. يركز جوهر الكتالوج على فهرسة البيانات من مصادر مختلفة وزيادة تلك البيانات الوصفية بسياق أعمال إضافي لبناء الثقة، وتسهيل اتخاذ قرارات أفضل للمستهلكين الذين يبحثون عن البيانات.
    1. توحيد المصطلحات – يمكنك توحيد مصطلحات عملك للتواصل بين ناشري البيانات والمستهلكين من خلال إنشاء مسارد وتضمين أوصاف تفصيلية للمصطلحات إلى جانب علاقات المصطلحات. يمكن تعيين هذه المصطلحات على الأصول والأعمدة وتساعد على توحيد وصف هذه الأصول وتساعد في اكتشاف وفهم تفاصيل البيانات الأساسية.
    2. اللبنات الأساسية لتخصيص بيانات تعريف الأعمال - لتسهيل إنشاء الكتالوج الخاص بك مع إمكانية التوسعة، تقدم Amazon DataZone بعض العناصر الأساسية التي يمكن توسيعها لتناسب احتياجاتك. يمكن استخدام أنواع نماذج البيانات التعريفية وأنواع الأصول كقوالب لتحديد الأصول الخاصة بك. يمكن تخصيص هذه الأنواع لزيادة السياق والتفاصيل الإضافية لتناسب متطلبات المجال. في هذا الإصدار، توفر Amazon DataZone بعض أنواع نماذج البيانات التعريفية المبتكرة مثل نموذج جدول AWS Glue، الأمازون الأحمر شكل الجدول, خدمة Amazon Simple Storage (Amazon S3) نموذج الكائن لدعم أنواع الأصول الجاهزة مثل جداول وطرق عرض AWS Glue وجداول وطرق عرض Amazon Redshift وكائنات S3.
    3. كتالوج الأصول المنظمة وغير المنظمة والمخصصة – لا يمكنك الآن فهرسة كتالوجات بيانات AWS Glue أو جداول Amazon Redshift فحسب، بل يمكنك أيضًا فهرسة الأصول المخصصة باستخدام واجهات برمجة تطبيقات Amazon DataZone. يمكن أن تمثل الأصول المفهرسة وحدة أصول مستهلكة قد تتضمن جدولاً أو لوحة معلومات أو نموذج ML أو مقطع تعليمات برمجية SQL يعرض الاستعلام خلف لوحة المعلومات. باستخدام الأصول المخصصة، توفر Amazon DataZone القدرة على إرفاق أنواع نماذج البيانات التعريفية بنوع الأصل ثم تعزيزها بسياق الأعمال، بما في ذلك مصطلحات مسرد الأعمال الموحدة لتحسين استهلاك تلك الأصول. بالإضافة إلى ذلك، بالنسبة لكتالوجات بيانات AWS Glue وجداول Amazon Redshift، يمكنك استخدام مصادر بيانات Amazon DataZone لإحضار بيانات التعريف الفنية لمجموعات البيانات إلى كتالوج بيانات الأعمال بطريقة مُدارة وفقًا لجدول زمني. كما تدعم الأصول الآن المراجعات، مما يسمح للمستخدمين بتحديد التغييرات في بيانات التعريف التجارية والتقنية.
    4. إنشاء اسم العمل الآلي - قد يستغرق إثراء الكتالوج الفني المستوعب بسياق الأعمال وقتًا طويلاً ومرهقًا وعرضة للخطأ. ولجعل الأمر أكثر بساطة، نقدم الميزة الأولى التي توفر إمكانات الذكاء الاصطناعي التوليدي (AI) إلى Amazon DataZone لأتمتة إنشاء الاسم وأسماء الأعمدة للأصل. توصي Amazon DataZone بإضافتها إلى الأصل، ثم تقوم بتفويض التحكم إلى المنتج لقبول تلك التوصيات أو رفضها.
  3. الحكم الموحد باستخدام مشاريع البيانات - تعمل مشاريع بيانات Amazon DataZone على تبسيط الوصول إلى تحليلات AWS من خلال إنشاء مجموعات قائمة على حالات الاستخدام الخاصة بالمستخدمين وأصول البيانات وأدوات التحليلات. توفر مشاريع البيانات مساحة حيث يمكن لأعضاء المشروع التعاون وتبادل البيانات ومشاركة العناصر. تكون المشاريع آمنة بحيث لا يتمكن سوى المستخدمين الذين تمت إضافتهم إلى المشروع من التعاون معًا. من خلال المشاريع، تعمل Amazon DataZone على تحقيق اللامركزية في ملكية البيانات بين الفرق اعتمادًا على من يملك البيانات، كما تعمل أيضًا على توحيد إدارة الوصول لهؤلاء المالكين عندما يطلب المستهلكون الوصول إلى البيانات. تشمل القدرات الأساسية المتوفرة في المشاريع ما يلي:
    1. الملكية وإدارة المستخدم - في المنظمة، تختلف الأدوار والمسؤوليات المتاحة للأشخاص المختلفين. لتخصيص تحديد ما يمكن لمستخدم أو مجموعة القيام به عند العمل مع كيانات Amazon DataZone، تعمل المشاريع الآن أيضًا كآلية لإدارة المستخدمين أو الأدوار. كل كيان في Amazon DataZone، مثل المسارد ونماذج البيانات التعريفية والأصول، مملوك للمشروعات.
    2. المشاريع والبيئات - تم الآن فصل المشاريع عن البنية التحتية - هناك إنشاء مشروع يتعامل مع إعداد المستخدمين إما كمالكين للمشروع أو مساهمين، ثم إعداد الموارد المسماة البيئات. تتعامل البيئات مع البنية التحتية (على سبيل المثال، قاعدة بيانات AWS Glue) اللازمة للمستخدمين للتعامل مع البيانات. يمكّن هذا التقسيم المشروع من أن يكون حاوية حالة الاستخدام، بينما توفر البيئة المرونة للتفرع إلى بيئات بنية تحتية مختلفة (على سبيل المثال، مستودعات البيانات أو مستودعات البيانات باستخدام Amazon Redshift). يمكن للمسؤولين تحديد نوع البنية التحتية التي يجب أن تكون متاحة لأي نوع من المشاريع.
    3. قم بإحضار دور IAM الخاص بك للاشتراك - يمكنك الآن إحضار مدير IAM موجود من خلال تسجيله كهدف اشتراك والحصول على موافقة الوصول إلى البيانات لمستخدم أو دور IAM هذا. باستخدام هذه الآلية، تقدم المشاريع الدعم للعمل مع البيانات في خدمات AWS الأخرى لأنه يمكنك السماح للمستخدمين باكتشاف البيانات والحصول على الموافقة اللازمة والوصول إلى البيانات في خدمة حصل المستخدم على تصريح مسبق لها.
    4. اشترك في سير العمل مع إدارة الوصول - يعمل سير عمل الاشتراك على تأمين البيانات بين المنتجين والمستهلكين للتحقق من وصول المستخدمين المناسبين فقط إلى البيانات الصحيحة للغرض الصحيح، مما يتيح تحليل بيانات الخدمة الذاتية. تسمح لك هذه الإمكانية أيضًا بالتدقيق السريع لمن يمكنه الوصول إلى مجموعات البيانات الخاصة بك فيما يتعلق بحالة استخدام الأعمال بالإضافة إلى مراقبة الاستخدام والتكاليف عبر المشاريع وخطوط الأعمال. تتم إدارة إدارة الوصول للأصول المنشورة في الكتالوج باستخدام تكوين بحيرة AWS أو Amazon Redshift، وسيتم إعلامك (في البوابة أو في Amazon CloudWatch) إذا تمت الموافقة على طلب الاشتراك الخاص بك ومنحه. بالنسبة للبيانات التي لا تتم إدارتها بواسطة AWS Lake Formation أو Amazon Redshift، يمكنك إدارة الموافقة على الاشتراك في Amazon DataZone وإكمال سير العمل الممنوح للوصول باستخدام المنطق المخصص باستخدام أمازون إيفينت بريدج الأحداث ثم قم بإبلاغ Amazon DataZone باستخدام واجهة برمجة التطبيقات (API) بمجرد اكتمال المنحة. وهذا يضمن أن المستهلك لن يتفاعل إلا مع خدمة واحدة لاكتشافها وفهمها وفهمها الاشتراك في البيانات ما هو مطلوب لتحليلهم.
    5. أدوات أناليتيكش – توفر بوابة Amazon DataZone بشكل خارج الصندوق التكامل مع محرر استعلام Amazon Athena ومحرر استعلام Amazon Redshift كأدوات لمعالجة البيانات. يوفر هذا التكامل وصولاً سلسًا إلى أدوات الاستعلام ويمكّن المستخدمين من استخدام أصول البيانات التي تم الاشتراك فيها داخل المشروع. ويتم تحقيق ذلك باستخدام بيئات Amazon DataZone التي يمكن نشرها وفقًا لتعريفات تكوين الموارد في المخططات المضمنة.
  4. واجهات برمجة التطبيقات - لدى Amazon DataZone الآن واجهات برمجة التطبيقات الخارجية للعمل مع النظام برمجيًا. يمكنك إضافة Amazon DataZone إلى بنيتك الحالية. على سبيل المثال، لاستخدام مسارات البيانات الخاصة بك لفهرسة البيانات في Amazon DataZone وتمكين المستهلكين من البحث عن تلك البيانات والعثور عليها والاشتراك فيها والوصول إليها بسلاسة. في هذا الإصدار، تقدم Amazon DataZone نموذج بيانات جديدًا للكتالوج. تدعم واجهات برمجة تطبيقات الكتالوج نموذجًا يستند إلى نظام النوع الذي يسمح لك بتحديد وإدارة أنواع الكيانات في الكتالوج. باستخدام نموذج نظام النوع هذا، سيكون لدى المستخدمين كتالوج مرن وقابل للتطوير يمكنه تمثيل أنواع مختلفة من الكائنات وربط البيانات التعريفية بالكائن (الأصل أو العمود). وبالمثل، تحتوي الإجراءات في واجهة المستخدم الآن على واجهات برمجة التطبيقات التي يمكنك استخدامها إذا كنت تريد العمل مع Amazon DataZone برمجيًا.

حالات استخدام العملاء الشائعة لـ Amazon DataZone

دعونا نلقي نظرة على بعض حالات الاستخدام التي قام عملاء المعاينة لدينا بتمكينها باستخدام Amazon DataZone.

حالة الاستخدام 1: إمكانية اكتشاف البيانات 

"بريستول مايرز سكويب تتابع بنشاط مبادرة لتقليل الوقت الذي يستغرقه اكتشاف الأدوية وتطويرها بنسبة تزيد عن 30%. أحد العناصر الرئيسية لهذه الاستراتيجية هو معالجة تحديات تبادل البيانات وتحسين توافر البيانات. من خلال التعامل مع AWS، وجدنا أن Amazon DataZone ساعدنا في إنشاء منتجات البيانات الخاصة بنا وفهرستها وإدارتها، جعل بياناتنا أكثر قابلية للعثور عليها والوصول إليها وقابلية التشغيل البيني وإعادة الاستخدام (FAIR). نقوم حاليًا بتقييم مدى قابلية تطبيق Amazon DataZone على نطاق أوسع ضمن إطار عمل مؤسستنا لتحديد ما إذا كان يتوافق مع أهدافنا التشغيلية." 

—ديفيد واي. ليو، مدير هندسة حلول تكنولوجيا المعلومات للأبحاث. بريستول مايرز سكويب.

حالة الاستخدام 2: مشاركة البيانات المحكومة لمبادرات الذكاء الاصطناعي الإبداعية

"من خلال تنسيق البيانات عبر مجالات الأعمال المتعددة، يمكننا تحقيق ذلك تعزيز ثقافة تبادل البيانات. ولتحقيق هذه الغاية، كنا نستخدم Amazon DataZone لتحرير المطورين لدينا من إنشاء النظام الأساسي وصيانته، مما يسمح لهم بالتركيز على الحلول المخصصة. كان استخدام خدمة AWS المُدارة أمرًا مهمًا بالنسبة لنا لعدة أسباب—الجمع بين القدرات داخل نظام AWS البيئي، وقت أسرع للحصول على رؤى الأعمال من تحليل البيانات، وتعريفات البيانات الموحدة، و الاستفادة من إمكانات الذكاء الاصطناعي التوليدي. نحن نتطلع إلى شراكتنا المستمرة مع AWS لتحقيق نتائج أفضل صحة الحارس والمرضى الذين نخدمهم. وهذا أكثر من مجرد بيانات؛ إنها رحلتنا الديناميكية."

—راجيش كوشارلاباتي، المدير الأول للبيانات وإدارة علاقات العملاء والتحليلات في Guardant Health

حالة الاستخدام 3: إدارة البيانات الموحدة

"إن الاعتماد على البيانات هو أحد أهدافنا الرئيسية دائمًا مسترشدين بأفضل الممارسات في إدارة البيانات وخصوصية البيانات وأمنها. في إيتاو ، يتم التعامل مع البيانات باعتبارها واحدة من الأصول الرئيسية لدينا؛ تعد الإدارة الجيدة للبيانات وتعريفها جزءًا أساسيًا من حلولنا، في كل استخدام لخدمات تحليلات AWS. بالتعاون مع فريق AWS، تمكنا من تجربة Amazon DataZone في المعاينة، واقتراح ميزات تتوافق مع احتياجاتنا التكنولوجية والتجارية. أحد الأمثلة هو البيانات حسب المجال، وتبسيط عمليات إدارة البيانات وتوزيع المسؤوليات بين وحدات الأعمال. مع توفر Amazon DataZone بشكل عام للمساهمين لدينا، نتوقع أن نكون قادرين على إعداد القواعد بسرعة وسهولة عبر المجالات للفرق المكونة من محللي البيانات والمهندسين والعلماء، مما يعزز تجربة فرضيات البيانات عبر حالات استخدام الأعمال المتعددة، مع حوكمة مبسطة. "

—بريسيلا كاردوسو فيريرا، مشرفة إدارة البيانات والخصوصية، Itaú Unibanco

حالة الاستخدام 4: الملكية اللامركزية

"في مرحبا لوز، توحيد البيانات عبر أعمالنا أثناء وجود الملكية الموزعة مع الفرق الفردية إن مشاركة بياناتهم وإدارتها هي أولوياتنا الرئيسية. إن بياناتنا مملوكة لفرق مختلفة، وعادة ما تعني المشاركة أن على الفريق المركزي منح حق الوصول، مما أدى إلى اختناق في عملياتنا. نحن بحاجة طريقة أسرع لتحليل البيانات مع الملكية اللامركزية، حيث يمكن الموافقة على الوصول إلى البيانات من قبل الفريق المالك. لقد تحققنا من صحة حالات الاستخدام في معاينة Amazon DataZone ونتطلع إلى البدء عندما يكون متاحًا بشكل عام لإنشاء كتالوج قوي لبيانات الأعمال. سيتمكن عملاؤنا من العثور على الأصول التي تم إنشاؤها حديثًا والاشتراك فيها ونشرها مرة أخرى ليكتشفها الآخرون ويستخدمونها، تمكين دولاب الموازنة البيانات".

—داني أوباندو، مهندس البيانات الرئيسي، Holaluz

استخدم الحالة رقم 5: الخدمة المُدارة مقابل منصة "افعلها بنفسك" (DIY).

"في BTG Pactualيعد توحيد البيانات عبر أعمالنا والسماح بمشاركة البيانات على نطاق واسع مع فرض الرقابة إحدى أولوياتنا الرئيسية. وبينما نقوم ببناء حلول مخصصة للقيام بذلك بأنفسنا، فإننا نفضل أن يكون لدينا خدمة AWS أصلية لتمكين هذه الإمكانات حتى نتمكن من ذلك تركيز جهودنا التنموية وموارد حول حل تحديات الحوكمة المحددة لشركة BTG Pactual - بدلاً من بناء النظام الأساسي وصيانته. لقد تحققنا من صحة حالات الاستخدام في معاينة Amazon DataZone وسنستخدمها لإنشاء كتالوج قوي لبيانات الأعمال وسير عمل مشاركة البيانات. سيوفر رؤية كاملة لمن يستخدم البيانات ولأي أغراض دون إضافة عبء عمل إضافي أو إعاقة الملكية اللامركزية التي أنشأناها جعل البيانات قابلة للاكتشاف ويمكن لجميع مستخدمي البيانات لدينا الوصول إليها في جميع أنحاء المنظمة."

—جواو موتا، رئيس منصة البيانات، BTG Pactual

تجول الحل

لنأخذ مثالاً لكيفية بدء مؤسسة ما باستخدام Amazon DataZone. في هذا المثال، قمنا ببناء بيئة موحدة لمنتجي البيانات ومستهلكي البيانات للوصول إلى البيانات ومشاركتها واستهلاكها بطريقة محكومة.

خذ على سبيل المثال فريق تسويق المنتج الذي يريد قيادة حملة حول اعتماد المنتج. لتحقيق النجاح في تلك الحملة، يريدون الاستفادة من بيانات العملاء في مستودع البيانات، وبيانات تدفق النقرات في بحيرة البيانات، وبيانات أداء الحملات الأخرى في تطبيقات مثل Salesforce. روبرتو مهندس بيانات يعرف هذه البيانات جيدًا. لذا، دعونا نرى كيف سيجعل روبرتو هذه البيانات قابلة للاكتشاف للآخرين في المؤسسة.

قام مسؤول الشركة بالفعل بإعداد مجال يسمى "التسويق" ليستخدمه الفريق. قام المسؤول أيضًا بإعداد بعض قوالب الموارد التي تسمى "المخططات" للسماح لأفراد البيانات بإعداد بيئات للعمل مع البيانات. قام المسؤول أيضًا بإعداد المستخدمين الذين يمكنهم تسجيل الدخول باستخدام بيانات اعتماد الشركة إلى بوابة Amazon DataZone، وهو تطبيق ويب خارج وحدة تحكم AWS. يقوم المسؤول بإعداد جميع موارد AWS حتى لا يضطر موظفو البيانات إلى مواجهة العوائق التقنية.

لذلك، دعونا الآن ندخل في تفاصيل كيفية تمكن روبرتو من نشر البيانات في الكتالوج.

  1. يقوم روبرتو بتسجيل الدخول إلى بوابة Amazon DataZone باستخدام بيانات اعتماد شركته.
  2. يقوم بإنشاء مشروع وبيئة يمكنه استخدامها لنشر البيانات. إنه يعرف مصادر البيانات التي يريد فهرستها، لذلك يقوم بإنشاء اتصال بـ AWS Glue Catalog الذي يحتوي على جميع بيانات تدفق النقرات.
  3. ويقدم اسمًا ووصفًا لتشغيل مصدر البيانات ثم يحدد قواعد البيانات وتفاصيل الجدول الذي يريد إحضاره.
  4. لقد اختار خيار إنشاء بيانات التعريف تلقائيًا للحصول على أسماء الأعمال التي تم إنشاؤها بواسطة تعلم الآلة لأسماء الجداول والأعمدة الفنية. ثم يقوم بجدولة التشغيل للحفاظ على تزامن الأصل مع المصدر.
  5. في غضون دقائق قليلة، ستكون بيانات تدفق النقرات ومعلومات العميل من البيانات التعريفية لـ Amazon Redshift، مثل أسماء الجداول والمخطط وبيانات تعريف المصدر الأخرى، متاحة في مخزون Amazon DataZone، وتكون جاهزة للتنظيم.
  6. يمكن لـ Roberto الآن إثراء البيانات التعريفية لتوفير سياق عمل إضافي باستخدام نماذج المصطلحات والبيانات التعريفية لتسهيل فهم البيانات على Veronica ومحلل بيانات Adata وغيرهم من العاملين في مجال البيانات. يمكن لروبرتو قبول أو رفض التوصيات التي يتم إنشاؤها تلقائيًا للإكمال التلقائي للأسماء المناسبة للأعمال. ويمكنه أيضًا تقديم الأوصاف وتصنيف المصطلحات وأي معلومات أخرى مفيدة لهذا الأصل المعين.
  7. بمجرد الانتهاء من ذلك، يمكن لروبرتو نشر الأصل وإتاحته لمستهلكي البيانات في Amazon DataZone.

الآن، دعونا نلقي نظرة على كيف يمكن لفيرونيكا، محللة التسويق، البدء في اكتشاف البيانات والتعامل معها.

  1. الآن بعد أن تم نشر البيانات وإتاحتها في الكتالوج، يمكن لفيرونيكا تسجيل الدخول إلى بوابة Amazon DataZone باستخدام بيانات اعتماد الشركة الخاصة بها والبدء في البحث عن البيانات. تكتب "حملة النقر" في البحث، ويتم إرجاع جميع الأصول ذات الصلة.
  2. لاحظت أن الأصول تأتي من مصادر وسياقات مختلفة. وهي تستخدم عوامل التصفية لتنظيم قائمة البحث باستخدام جوانب مثل مصطلحات المسارد ومصادر البيانات وفرز النتائج بناءً على مدى الصلة بالموضوع والوقت.
  3. لبدء العمل مع البيانات، سيتعين عليها إنشاء مشروع جديد وبيئة توفر الأدوات التي تحتاجها. يوفر إنشاء المشروع طريقة سريعة لها للتعاون مع زملائها في الفريق وتزويدهم تلقائيًا بالمستوى الصحيح من الأذونات للعمل مع البيانات والأدوات.
  4. تجد فيرونيكا البيانات التي تحتاج إلى الوصول إليها. وهي الآن تطلب الوصول من خلال النقر على اشتراك لإبلاغ ناشر البيانات أو مالكها بأنها بحاجة إلى الوصول إلى البيانات. أثناء الاشتراك، تقدم أيضًا سببًا لحاجتها إلى الوصول إلى تلك البيانات.
  5. يؤدي هذا إلى إرسال إشعار إلى روبرتو وأعضاء مشروعه بأن هناك من يبحث عن الوصول، ويمكنهم مراجعة الطلب لقبوله أو رفضه. قام روبرت بتسجيل الدخول إلى البوابة الإلكترونية، وشاهد الإشعار، ووافق على الطلب لأن السبب كان واضحًا جدًا.
  6. ومن خلال الاشتراك المعتمد، تحصل Veronica أيضًا على إمكانية الوصول إلى البيانات حيث تقوم Amazon DataZone بذلك تلقائيًا لصالح Roberto. الآن يمكن لفيرونيكا وفريقها البدء في العمل على تحليلهم للعثور على الحملة المناسبة لزيادة اعتمادها.

لذلك، تتم دورة حياة اكتشاف البيانات والوصول إليها واستخدامها بالكامل من خلال Amazon DataZone. يمكنك الحصول على رؤية كاملة والتحكم في كيفية مشاركة البيانات ومن يستخدمها ومن سمح لها. في الأساس، تسمح لك Amazon DataZone بمنح أعضاء مؤسستك الحرية التي يريدونها دائمًا، مع ثقة الإدارة الصحيحة من حولهم.

فيما يلي لقطة شاشة لبوابة Amazon DataZone للمستخدمين لتسجيل الدخول إلى البيانات المطلوبة لتحليلها ونشرها واكتشافها وفهمها والاشتراك فيها.

وفي الختام

في هذا المنشور، ناقشنا التحديات والقدرات الأساسية وبعض حالات الاستخدام الشائعة. من خلال نموذج سيناريو، أظهرنا كيف يمكنك البدء. Amazon DataZone متاح الآن بشكل عام. لمزيد من المعلومات، راجع ما الجديد في Amazon DataZone or أمازون داتازون.

افحص يوتيوب قائمة التشغيل للحصول على بعض أحدث العروض التوضيحية لـ Amazon DataZone وأوصاف مختصرة للإمكانيات المتاحة.


عن المؤلفين

شيخا فيرما هو رئيس منتج Amazon DataZone في AWS.

ستيف ماكفرسون يشغل منصب المدير العام لشركة Amazon DataZone في AWS.

بريا تيروثاني هو مدير أول للمنتجات في Amazon DataZone في AWS.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة