Zephyrnet Logosu

Amazon DataZone'u kullanarak kurumsal sınırların ötesindeki verilere erişim sağlayın - artık genel kullanıma sunuldu | Amazon Web Hizmetleri

Tarih:

Genel kullanılabilirliğini duyurmaktan heyecan duyuyoruz Amazon DataZone. Amazon DataZone, müşterilerin kuruluş sınırlarının ötesinde geniş ölçekte verileri keşfetmesine, erişmesine, paylaşmasına ve yönetmesine olanak tanıyarak, verileri ve analiz araçlarını kuruluştaki herkes için erişilebilir hale getirmenin ağır yükünü azaltır. Amazon DataZone ile veri mühendisleri, veri bilimcileri ve veri analistleri gibi veri kullanıcıları, birleşik bir veri portalı kullanarak AWS hesapları genelinde verilere paylaşabilir ve bu verilere erişebilir; böylece ekipleri ve kuruluşları genelinde bu verileri keşfedebilir, kullanabilir ve bunlar üzerinde işbirliği yapabilirler. Ek olarak, veri sahipleri ve veri yöneticileri, verilere iş bağlamı ekleyerek veriye erişim yönetimini önceden tanımlanmış araçlarla dengeleyerek veri keşfini kolaylaştırabilir. onay iş akışları kullanıcı arabiriminde.

Bu blog yazısında, müşterilerimizden bizi Amazon DataZone'u oluşturmaya yönlendiren şeyleri paylaşıyoruz ve genel önizlememiz sırasında Amazon DataZone'u deneyen müşterilerden gelen belirli müşteri kullanım örneklerini ve alıntılarını tartışıyoruz. Daha sonra Amazon DataZone'un avantajlarını açıklayıp temel özellikler konusunda size yol göstereceğiz.

Veri yönetimi ve yönetişimin ortak sıkıntı noktaları:

  1. Verilerin keşfi, özellikle hesaplar ve bölgeler arasında dağıtılan veriler - Kuruluşların genellikle onlarca, hatta binlerce veri kaynağına yayılmış petabaytlarca verisi olduğundan, analiz için kullanılacak verileri bulmak zordur.
  2. Verilere erişim – Veri erişimi kontrolü zordur, kuruluşlar arasında farklı şekilde yönetilir ve çoğu zaman manuel onaylar gerektirir; bu da zaman alıcı bir süreç olabilir ve güncel tutulması zor olabilir, bu da analistlerin ihtiyaç duydukları verilere erişememesine neden olur.
  3. Araçlara erişim – Veri kullanıcıları, aynı yönetilen verilerle farklı tercih edilen araçları kullanmak ister. Verilere erişim her araç tarafından farklı şekilde yönetildiğinden bu zordur.
  4. İşbirliği – Analistler, veri bilimcileri ve veri mühendisleri, uçtan uca analiz yolculuğunda genellikle farklı adımlara sahiptir ancak kendi seçtikleri araçları kullanarak aynı yönetilen veriler üzerinde işbirliği yapmanın basit bir yoluna sahip değildir.
  5. Veri yönetimi – Verileri yönetmeye yönelik yapılar, ayrı araçlar içinde gizlenir ve farklı ekipler tarafından farklı şekilde yönetilir; bu da kuruluşların kimin neye ve neden eriştiği konusunda izlenebilirliğe sahip olmasını engeller.

Amazon DataZone'un üç temel avantajı

Amazon DataZone, müşterilerin kuruluş sınırlarının ötesinde geniş ölçekte verileri keşfetmesine, paylaşmasına ve yönetmesine olanak tanır.

  • Veri erişimini kurumsal sınırların ötesinde yönetin. Bireysel kimlik bilgilerine ihtiyaç duymadan, kuruluşunuzun güvenlik düzenlemelerine uygun olarak doğru verilere, doğru kullanıcı tarafından, doğru amaç için erişilmesini sağlamaya yardımcı olun. Yönetilen bir iş akışıyla veri varlığı kullanımına ilişkin şeffaflık sağlayın ve veri aboneliklerini onaylayın. Kullanım denetimi yetenekleri aracılığıyla projelerdeki veri varlıklarını izleyin.
  • İş öngörülerini artırmak için veri çalışanlarını paylaşılan veriler ve araçlar aracılığıyla birbirine bağlayın. Ekipler arasında sorunsuz bir şekilde işbirliği yaparak ve verilere ve analiz araçlarına self servis erişim sağlayarak iş ekibinizin verimliliğini artırın. Kataloglanmış verileri aramak, paylaşmak ve bunlara erişmek için iş terimlerini kullanın; böylece, yapılandırılmış tüm kullanıcıların, iş sözlüğüyle kullanmak istedikleri veriler hakkında daha fazla bilgi edinmelerini sağlayın.
  • Makine öğrenimi (ML) ile veri keşfini ve kataloglamayı otomatikleştirin. Veri niteliklerini iş verileri kataloğuna manuel olarak girmek için gereken süreyi azaltın ve hataların ortaya çıkmasını en aza indirin. Veri kataloğundaki daha fazla ve daha zengin veriler, arama deneyimini de geliştirir. Veri arama ve kullanma sürenizi haftalardan günlere indirin.

Amazon DataZone'un müşterilerine sağladığı temel avantajlar şunlardır.

Şekil 1: Amazon DataZone'un Avantajları

Şekil 1: Amazon DataZone'un Avantajları

Bu faydaları sağlamak için bu hizmette hangi yeteneklerin yerleşik olduğunu görelim.

Şekil 2: Amazon DataZone'un yetenekleri

Şekil 2: Amazon DataZone'un yetenekleri

Amazon DataZone aşağıdaki ayrıntılı yetenekleri sağlar.

  1. İş odaklı alanlar – DataZone alanı, bir kuruluş içindeki kendi veri varlıkları, kendi veri tanımı veya iş terminolojisi de dahil olmak üzere kendi verilerini yönetebilen bir iş kolunun (LOB) veya iş alanının belirgin sınırını temsil eder ve kendi veri tanımına veya iş terminolojisine sahip olabilir. standartları yönetir. Etki alanı, müşterinin Amazon DataZone yolculuğunun başlangıç ​​noktasıdır. DataZone'u ilk kullanmaya başladığınızda, bir etki alanı ve bir etki alanı içinde yer alacak iş verileri kataloğu, projeler ve ortamlar gibi tüm temel bileşenleri oluşturursunuz.
    1. Bir Amazon DataZone alanı ilişkili bir iş verileri kataloğu içerir arama ve keşif için, keşif amacıyla kullanılan veri varlıklarını süslemek için bir dizi meta veri tanımı ve kullanıcıların ve grupların veri varlıklarını tüketmesi ve yayınlaması için entegre analitik ve makine öğrenimi araçları içeren veri projeleri.
    2. Bir Amazon DataZone etki alanı şunları yapabilir: birden fazla AWS hesabına yayılma bu hesaplardaki veri gölü veya veri ambarı verilerini bağlayıp çekerek (örneğin, AWS Tutkal Veri Kataloğu) bir veri ağı oluşturmak veya desteklenen AWS Bölgeleri genelinde bu hesaplarda projeler ve ortamlar oluşturup çalıştırmak için.
    3. Amazon DataZone alan adları aşağıdaki yetenekleri beraberinde getirir: AWS Kaynak Erişim Yöneticisi (AWS RAM) için Kaynakları hesaplar arasında güvenli bir şekilde paylaşın.
    4. Amazon DataZone etki alanı oluşturulduktan sonra etki alanı, kuruluşun yapılandırılmış kullanıcılarının verileri kataloglayabildiği, keşfedebildiği, yönetebildiği, paylaşabildiği ve analiz edebildiği tarayıcı tabanlı bir web uygulaması sağlar. self servis moda. Veri portalı, kimlik sağlayıcılarını aşağıdakiler aracılığıyla destekler: AWS IAM Kimlik Merkezi (AWS Tek Oturum Açma'nın halefi) ve AWS Kimlik ve Erişim Yönetimi (IAM) Kimlik doğrulamanın esasları.
    5. Örneğin, bir pazarlama ekibi "Pazarlama" adında bir alan adı oluşturabilir ve bu alanın tam mülkiyetine sahip olabilir. Benzer şekilde, bir satış ekibi "Satış" adında bir alan adı oluşturabilir ve bu alanın tam mülkiyetine sahip olabilir. Satış, verileri pazarlama ile paylaşmak istediğinde, pazarlama ekibi, bu hesabı pazarlama etki alanıyla ilişkilendirerek bir satış hesabına erişim sağlayabilir ve satış kullanıcısı, verilerini pazarlama ekibiyle paylaşmak için pazarlama etki alanının Amazon DataZone portal bağlantısını kullanabilir.
  2. Kuruluş çapında iş verileri kataloğu - Yapabilirsin Kullanıcılarınızın verileri hızlı ve verimli bir şekilde bulup anlaması için iş bağlamıyla birlikte görünür veriler. Kataloğun özü, farklı kaynaklardan gelen verileri kataloglamaya ve güven oluşturmak ve veri arayan tüketicilerin daha iyi karar vermesini kolaylaştırmak için bu meta verileri ek iş bağlamıyla genişletmeye odaklanmıştır.
    1. Terminolojiyi standartlaştırın – Sözlükler oluşturarak ve terim ilişkilerinin yanı sıra terimler için ayrıntılı açıklamalar ekleyerek veri yayıncıları ve tüketiciler arasında iletişim kurmak için iş terminolojinizi standartlaştırabilirsiniz. Bu terimler varlıklara ve sütunlara eşlenebilir ve bu varlıkların açıklamasını standartlaştırmaya ve temeldeki verilerin ayrıntılarının keşfedilmesine ve anlaşılmasına yardımcı olabilir.
    2. İş meta verilerini özelleştirmek için yapı taşları – Kataloğunuzu genişletilebilirlikle oluşturmayı kolaylaştırmak için Amazon DataZone, ihtiyaçlarınıza göre genişletilebilecek bazı temel yapı taşlarını sunar. Meta veri form türleri ve varlık türleri, varlıklarınızı tanımlamak için şablon olarak kullanılabilir. Bu türler, bir alanın gereksinimlerine uyacak şekilde ek bağlam ve ayrıntıları artırmak üzere özelleştirilebilir. Bu sürümde Amazon DataZone, AWS Glue tablo formu gibi bazı kullanıma hazır meta veri form türlerini sağlar. Amazon Kırmızıya Kaydırma tablo formu, Amazon Basit Depolama Hizmeti (Amazon S3) AWS Glue tabloları ve görünümleri, Amazon Redshift tabloları ve görünümleri ile S3 nesneleri gibi kullanıma hazır varlık türlerini destekleyen nesne formu.
    3. Katalog yapılandırılmış, yapılandırılmamış ve özel varlıklar – Artık yalnızca AWS Glue veri kataloglarını veya Amazon Redshift tablolarını değil, Amazon DataZone API'lerini kullanarak özel varlıkları da kataloglayabilirsiniz. Kataloglanmış varlıklar, bir tablo, bir kontrol paneli, bir makine öğrenimi modeli veya kontrol panelinin arkasındaki sorguyu gösteren bir SQL kod bloğu içerebilen tüketilebilir bir varlık birimini temsil edebilir. Amazon DataZone, özel varlıklarla meta veri form türlerini bir varlık türüne ekleme ve ardından bu varlıkların daha iyi tüketilmesi için standartlaştırılmış iş sözlüğü terimleri de dahil olmak üzere bunu iş bağlamıyla genişletme olanağı sağlar. Ayrıca AWS Glue veri katalogları ve Amazon Redshift tabloları için, Amazon DataZone veri kaynaklarını kullanarak veri kümelerinin teknik meta verilerini belirli bir programa göre yönetilen bir şekilde iş verileri kataloğuna getirebilirsiniz. Varlıklar artık revizyonları da destekleyerek kullanıcıların iş ve teknik meta verilerdeki değişiklikleri tanımlamasına olanak tanıyor.
    4. Otomatik işletme adı oluşturma – Alınan teknik kataloğun iş bağlamıyla zenginleştirilmesi zaman alıcı, hantal ve hataya açık olabilir. Bunu kolaylaştırmak için, bir varlığın adının ve sütun adlarının oluşturulmasını otomatikleştirmek üzere Amazon DataZone'a üretken yapay zeka (AI) yetenekleri getiren ilk özelliği sunuyoruz. Amazon DataZone, varlığa eklenmesini önerir ve ardından bu önerileri kabul etmesi veya reddetmesi için kontrolü üreticiye devreder.
  3. Veri projelerini kullanan birleşik yönetim – Amazon DataZone veri projeleri, kullanıcı, veri varlıkları ve analiz araçlarından oluşan iş kullanım senaryosuna dayalı gruplamalar oluşturarak AWS analizlerine erişimi basitleştirir. Veri projeleri, proje üyelerinin işbirliği yapabileceği, veri alışverişinde bulunabileceği ve eserleri paylaşabileceği bir alan sağlar. Projeler güvenli olduğundan yalnızca projeye eklenen kullanıcılar birlikte işbirliği yapabilir. Amazon DataZone, projelerle, verinin sahibine bağlı olarak veri sahipliğini ekipler arasında dağıtır ve ayrıca tüketiciler verilere erişim talep ettiğinde erişim yönetimini bu sahiplerle birleştirir. Projelerde kullanıma sunulan temel yetenekler şunları içerir:
    1. Sahiplik ve kullanıcı yönetimi – Bir organizasyonda farklı kişilere sunulan roller ve sorumluluklar farklılık gösterir. Bir kullanıcının veya grubun Amazon DataZone varlıklarıyla çalışırken neler yapabileceğini tanımlamayı özelleştirmek için projeler artık aynı zamanda bir kullanıcı yönetimi veya rol mekanizması olarak da hizmet veriyor. Amazon DataZone'daki sözlükler, meta veri formları ve varlıklar gibi her varlık projelere aittir.
    2. Projeler ve ortamlar – Projeler artık altyapıdan ayrılmıştır – kullanıcıların proje sahibi veya katkıda bulunanlar olarak kurulumunu ve ardından ortamlar olarak adlandırılan kaynakların kurulumunu yöneten proje oluşturma vardır. Ortamlar, kullanıcıların verilerle çalışması için gereken altyapıyı (örneğin, AWS Glue veritabanı) yönetir. Bu bölünme, projenin kullanım senaryosu konteyneri olmasını sağlarken ortam, farklı altyapı ortamlarına (örneğin, Amazon Redshift kullanan veri gölleri veya veri ambarları) dallanma esnekliği sağlar. Yöneticiler, ne tür projeler için ne tür bir altyapının mevcut olması gerektiğini belirleyebilirler.
    3. Abonelik için kendi IAM rolünüzü getirin – Artık mevcut bir IAM sorumlusunu abonelik hedefi olarak kaydederek getirebilir ve söz konusu IAM kullanıcısı veya rolü için veri erişim onayı alabilirsiniz. Bu mekanizma sayesinde projeler, diğer AWS hizmetlerindeki verilerle çalışmaya yönelik desteği genişletir çünkü kullanıcıların verileri keşfetmesine, gerekli onayı almasına ve kullanıcının önceden yetkilendirdiği bir hizmetteki verilere erişmesine olanak tanıyabilirsiniz.
    4. İş akışına abone olun erişim yönetimi ile – Abonelik iş akışı, yalnızca doğru verilere doğru kullanıcılar tarafından doğru amaç için erişildiğini doğrulamak amacıyla üreticiler ve tüketiciler arasındaki verileri güvence altına alır ve self servis veri analitiğine olanak tanır. Bu özellik aynı zamanda hangi iş kullanım durumu için veri kümelerinize kimin erişebileceğini hızlı bir şekilde denetlemenize ve projeler ve iş kolları genelinde kullanımı ve maliyetleri izlemenize olanak tanır. Katalogda yayınlanan varlıklara yönelik erişim yönetimi, AWS Göl Oluşumu veya Amazon Redshift'e bağlandığınızda, abonelik isteğinizin onaylanıp kabul edildiği konusunda bilgilendirileceksiniz (portalda veya Amazon CloudWatch'ta). AWS Lake Formation veya Amazon Redshift tarafından yönetilmeyen veriler için abonelik onayını Amazon DataZone'da yönetebilir ve erişim izni verilen iş akışını özel mantıkla tamamlayabilirsiniz. Amazon EventBridge olayları yönetin ve hibe tamamlandıktan sonra API kullanarak Amazon DataZone'a rapor verin. Bu, tüketicinin yalnızca tek bir hizmeti keşfetmesi, anlaması ve öğrenmesi için arayüz oluşturmasını sağlar. verilere abone ol Bu onların analizi için gereklidir.
    5. Analytics araçları – Kutudan çıktığı haliyle Amazon DataZone portalı, verileri işlemeye yönelik araçlar olarak Amazon Athena sorgu düzenleyicisi ve Amazon Redshift sorgu düzenleyicisiyle entegrasyon sağlar. Bu entegrasyon, sorgu araçlarına kesintisiz erişim sağlar ve kullanıcıların proje kapsamında abone olunan veri varlıklarını kullanmalarına olanak tanır. Bu, yerleşik planlardaki kaynak yapılandırma tanımlarına göre dağıtılabilen Amazon DataZone ortamları kullanılarak gerçekleştirilir.
  4. API'ler – Amazon DataZone artık sistemle programlı olarak çalışmak için harici API'lere sahip. Amazon DataZone'u mevcut mimarinize ekleyebilirsiniz. Örneğin, verileri Amazon DataZone'da kataloglamak ve tüketicilerin bu verileri sorunsuz bir şekilde aramasını, bulmasını, abone olmasını ve erişmesini sağlamak için veri işlem hatlarınızı kullanmak. Bu sürümde Amazon DataZone, katalog için yeni bir veri modeli sunuyor. Katalog API'leri, katalogdaki varlık türlerini tanımlamanıza ve yönetmenize olanak tanıyan tür sistemi tabanlı bir modeli destekler. Bu tip sistem modelini kullanarak kullanıcılar, farklı nesne türlerini temsil edebilen ve meta verileri nesneyle (varlık veya sütun) ilişkilendirebilen esnek ve ölçeklenebilir bir kataloğa sahip olacaklar. Benzer şekilde, kullanıcı arayüzündeki eylemlerde artık Amazon DataZone ile programlı olarak çalışmak istiyorsanız kullanabileceğiniz API'ler bulunmaktadır.

Amazon DataZone için yaygın müşteri kullanım örnekleri

Önizleme müşterilerimizin Amazon DataZone ile etkinleştirdiği bazı kullanım örneklerine bakalım.

Durum 1'i kullanın: Veri keşfedilebilirliği 

"Bristol Myers Squibb'in fotoğrafı. ilaçları keşfetmek ve geliştirmek için gereken süreyi %30'dan fazla azaltmak için aktif olarak bir girişim yürütüyor. Bu stratejinin önemli bir bileşeni, veri paylaşımındaki zorluklar ve veri kullanılabilirliğinin optimize edilmesi. AWS ile etkileşime geçerek Amazon DataZone'un veri ürünlerimizi oluşturmamıza, bunları kataloglamamıza ve yönetmemize yardımcı olduğunu gördük. Verilerimizi daha bulunabilir, erişilebilir, birlikte çalışabilir ve yeniden kullanılabilir hale getirmek (FAIR). Şu anda Amazon DataZone'un operasyonel hedeflerimiz ile uyumlu olup olmadığını belirlemek için kurumsal çerçevemiz içerisinde daha geniş çapta uygulanabilirliğini değerlendiriyoruz." 

—David Y. Liu, Direktör, Araştırma BT Çözümü Mimarisi. Bristol Myers Squibb.

Kullanım örneği 2: Üretken yapay zeka girişimleri için yönetilen verileri paylaşın

"Birden fazla iş alanındaki verileri uyumlu hale getirerek şunları yapabiliriz: veri paylaşımı kültürünü teşvik etmek. Bu amaçla, geliştiricilerimizin bir platform oluşturma ve bakımını yapmalarını sağlamak ve onlara özel çözümlere odaklanmalarına olanak sağlamak için Amazon DataZone'u kullanıyoruz. AWS tarafından yönetilen bir hizmetten yararlanmak, AWS ekosistemindeki yetenekleri birleştirmek, iş öngörüleri elde etmek için daha hızlı zaman veri analizinden, standartlaştırılmış veri tanımlarından ve üretken yapay zekanın potansiyelinden yararlanıyor. Daha iyi sonuçlar elde etmek amacıyla AWS ile ortaklığımızın devamını sabırsızlıkla bekliyoruz. Guardant Sağlık ve hizmet verdiğimiz hastalar. Bu salt veriden daha fazlasıdır; bu bizim dinamik yolculuğumuz.”

—Rajesh Kucharlapati, Veri, CRM ve Analitik Kıdemli Direktörü, Guardant Health

Kullanım örneği 3: Birleştirilmiş veri yönetimi

“Veriye dayalı olmak her zaman ana kurumsal hedeflerimizden biridir. veri yönetişimi, veri gizliliği ve güvenliğindeki en iyi uygulamalar rehberliğinde. At İtalya, veriler ana varlıklarımızdan biri olarak kabul edilir; AWS analiz hizmetlerinin her kullanımında iyi veri yönetimi ve tanımlama, çözümlerimizin temel parçalarıdır. AWS ekibiyle birlikte Amazon DataZone'u önizleme aşamasında deneme olanağı bulduk ve teknolojik ve iş ihtiyaçlarımıza uygun özellikler önerdik. Bir örnek: etki alanına göre veriler, veri yönetimi süreçlerinin basitleştirilmesi ve sorumlulukların iş birimleri arasında dağıtılması. Amazon DataZone'un genel olarak katkıda bulunanlarımızın kullanımına sunulmasıyla, veri analistleri, mühendisler ve bilim adamlarından oluşan ekipler için etki alanları arasında hızlı ve kolay bir şekilde kurallar oluşturabilmeyi, basitleştirilmiş yönetişimle birden fazla iş kullanım senaryosunda veri hipotezi deneylerini teşvik edebilmeyi umuyoruz. ”

—Priscila Cardoso Ferreira, Veri Yönetişimi ve Gizlilik Sorumlusu, Itaú Unibanco

Kullanım örneği 4: Merkezi olmayan sahiplik

"At merhaba, Luz, işletmelerimiz genelinde verileri birleştirerek sahipliği bireysel ekiplere dağıtıldı Verilerini paylaşmak ve yönetmek temel önceliklerimizdir. Verilerimiz farklı ekiplere ait ve paylaşım genellikle merkezi ekibin erişim izni vermesi gerektiği anlamına geliyordu ve bu da süreçlerimizde bir darboğaz oluşturdu. İhtiyacımız vardı Merkezi olmayan sahiplik ile verileri analiz etmenin daha hızlı bir yolu, veri erişiminin sahibi ekip tarafından onaylanabileceği yer. Amazon DataZone önizlemesindeki kullanım örneklerini doğruladık ve sağlam bir iş verileri kataloğu oluşturmaya yönelik genel kullanıma sunulduğunda başlamayı sabırsızlıkla bekliyoruz. Tüketicilerimiz, yeni oluşturdukları varlıkları başkalarının keşfetmesi ve kullanması için bulabilecek, abone olabilecek ve yayınlayabilecek. veri volanını etkinleştirme".

—Danny Obando, Baş Veri Mimarı, Holaluz

Kullanım örneği #5: Yönetilen hizmet ile Kendin Yap (DIY) platformu karşılaştırması

"At BTG Paktı, işletmelerimiz genelinde verileri birleştirmek ve gözetimi güçlendirirken geniş ölçekte veri paylaşımına izin vermek temel önceliklerimizden biridir. Bunu kendimiz yapmak için özel çözümler geliştirirken, bu yetenekleri etkinleştirmek için bir AWS yerel hizmetine sahip olmayı tercih ediyoruz. geliştirme çabalarımıza odaklanın ve platformu oluşturmak ve sürdürmek yerine BTG Pactual'ın belirli yönetim zorluklarını çözmeye yönelik kaynaklar. Amazon DataZone önizlemesindeki kullanım örneklerini doğruladık ve bunu sağlam bir iş veri kataloğu ve veri paylaşımı iş akışı oluşturmak için kullanacağız. Ek iş yükü eklemeden veya kurduğumuz merkezi olmayan sahipliği engellemeden, kimin hangi verileri hangi amaçlarla kullandığına dair tam görünürlük sağlayacaktır. verileri tüm veri kullanıcılarımız için keşfedilebilir ve erişilebilir hale getirmek tüm organizasyonda."

—João Mota, Veri Platformu Başkanı, BTG Pactual

Çözüm yolu

Bir kuruluşun Amazon DataZone'u kullanmaya nasıl başlayabileceğine dair bir örnek verelim. Bu örnekte, veri üreticilerinin ve veri tüketicilerinin verilere yönetilen bir şekilde erişmesi, paylaşması ve tüketmesi için birleşik bir ortam oluşturuyoruz.

Ürünün benimsenmesine yönelik bir kampanya yürütmek isteyen bir ürün pazarlama ekibini ele alalım. Bu kampanyada başarılı olmak için veri ambarındaki müşteri verilerinden, veri gölündeki tıklama akışı verilerinden ve Salesforce gibi uygulamalardaki diğer kampanyaların performans verilerinden yararlanmak istiyorlar. Roberto bu verileri çok iyi bilen bir veri mühendisidir. Şimdi Roberto'nun bu verileri kuruluştaki diğer kişiler tarafından nasıl keşfedilebilir hale getireceğini görelim.

Şirketin yöneticisi, ekibin kullanması için zaten "Pazarlama" adında bir alan oluşturmuştur. Yönetici ayrıca veri çalışanlarının verilerle çalışacak ortamlar oluşturmasına olanak sağlamak için "Taslaklar" adı verilen bazı kaynak şablonları da oluşturmuştur. Yönetici aynı zamanda AWS Konsolu dışında bir web uygulaması olan Amazon DataZone portalında kurumsal kimlik bilgilerini kullanarak oturum açabilecek kullanıcıları da ayarlamıştır. Yönetici, tüm AWS kaynaklarını, veri çalışanlarının teknik engellerle uğraşmak zorunda kalmaması için ayarlar.

Şimdi Roberto'nun katalogdaki verileri nasıl yayınlayabileceğinin ayrıntılarına geçelim.

  1. Roberto, kurumsal kimlik bilgilerini kullanarak Amazon DataZone portalında oturum açar.
  2. Verileri yayınlamak için kullanabileceği bir proje ve ortam oluşturur. Kataloglamak istediği veri kaynaklarını bildiğinden tüm tıklama akışı verilerini içeren AWS Glue Catalog'a bir bağlantı oluşturur.
  3. Veri kaynağı çalıştırması için bir ad ve açıklama sağlar ve ardından veritabanlarını ve getirmek istediği tablonun ayrıntılarını seçer.
  4. Teknik tablo ve sütun adları için makine öğrenimi tarafından oluşturulan işletme adlarını almak amacıyla otomatik meta veri oluşturma seçeneğini tercih ediyor. Daha sonra varlığı kaynakla senkronize tutacak şekilde çalıştırmayı planlar.
  5. Birkaç dakika içinde Amazon Redshift meta verilerindeki tıklama akışı verileri ve müşteri bilgileri (tablo adları, şema ve diğer kaynak meta verileri gibi) Amazon DataZone'un envanterinde düzenlenmeye hazır hale gelecektir.
  6. Roberto artık Veronica, adata analisti ve diğer veri çalışanlarının verileri anlamasını kolaylaştırmak için sözlük ve meta veri formlarını kullanarak ek iş bağlamı sağlamak üzere meta verileri zenginleştirebilir. Roberto, iş dostu adların otomatik olarak tamamlanması için otomatik olarak oluşturulan önerileri kabul edebilir veya reddedebilir. Ayrıca söz konusu varlığa ilişkin açıklamalar, sınıflandırma terimleri ve diğer yararlı bilgileri de sağlayabilir.
  7. İşlem tamamlandıktan sonra Roberto, varlığı yayınlayabilir ve Amazon DataZone'daki veri tüketicilerinin kullanımına sunabilir.

Şimdi pazarlama analisti Veronica'nın verileri keşfetmeye ve verilerle çalışmaya nasıl başlayabileceğine bir göz atalım.

  1. Veriler artık katalogda yayınlandığı ve mevcut olduğu için Veronica, kurumsal kimlik bilgilerini kullanarak Amazon DataZone portalında oturum açabilir ve veri aramaya başlayabilir. Aramaya "tıklama kampanyası" yazıyor ve ilgili tüm varlıklar döndürülüyor.
  2. Varlıkların çeşitli kaynaklardan ve bağlamlardan geldiğini fark ediyor. Sözlük terimleri ve veri kaynakları gibi özellikleri kullanarak arama listesini düzenlemek için filtreler kullanıyor ve sonuçları ilgi ve zamana göre sıralıyor.
  3. Verilerle çalışmaya başlamak için yeni bir proje ve ihtiyaç duyduğu araçları sağlayan bir ortam yaratması gerekecek. Projeyi oluşturmak, ekip arkadaşlarıyla işbirliği yapmasına ve onlara veri ve araçlarla çalışmak için otomatik olarak doğru düzeyde izinler sağlamasına hızlı bir yol sağlar.
  4. Veronica, erişmesi gereken verileri bulur. Artık simgesine tıklayarak erişim istiyor Üye olun veri yayıncısına veya sahibine verilere erişmesi gerektiğini bildirmek. Abone olurken aynı zamanda bu verilere neden erişmesi gerektiğinin nedenini de belirtir.
  5. Bu, Roberto ve proje üyelerine birisinin erişim aradığına dair bir bildirim gönderir ve onlar da talebi inceleyerek kabul edebilir veya reddedebilir. Robert portalda oturum açtı, bildirimi gördü ve nedeni çok açık olduğu için isteği onayladı.
  6. Onaylanan abonelikle, Amazon DataZone bunu Roberto için otomatik olarak yaptığı için Veronica da verilere erişim elde ediyor. Artık Veronica ve ekibi, benimsenmeyi artıracak doğru kampanyayı bulmak için analizleri üzerinde çalışmaya başlayabilir.

Bu nedenle, veri keşfi ve erişim yaşam döngüsünün ve kullanımının tamamı Amazon DataZone üzerinden gerçekleşir. Verilerin nasıl paylaşıldığı, kimin kullandığı ve kimin yetki verdiği konusunda tam görünürlük ve kontrol elde edersiniz. Temel olarak Amazon DataZone, kuruluşunuzun üyelerine her zaman istedikleri özgürlüğü, etrafındaki doğru yönetimin güvencesiyle sunmanıza olanak tanır.

Kullanıcıların analizleri için gerekli verileri kataloglamak, yayınlamak, keşfetmek, anlamak ve abone olmak için oturum açabileceği Amazon DataZone portalının ekran görüntüsünü burada bulabilirsiniz.

Sonuç

Bu yazıda zorlukları, temel yetenekleri ve birkaç yaygın kullanım durumunu tartıştık. Örnek bir senaryo ile nasıl başlayabileceğinizi gösterdik. Amazon DataZone artık genel kullanıma sunuldu. Daha fazla bilgi için bakınız Amazon DataZone'daki Yenilikler or Amazon Veri Bölgesi.

Check out YouTube playlist Amazon DataZone'un en yeni demolarından bazıları ve mevcut yeteneklerin kısa açıklamaları için.


yazarlar hakkında

Şikha Verma AWS'de Amazon DataZone Ürün Müdürüdür.

Steve McPherson AWS'de Amazon DataZone'un Genel Müdürüdür.

Priya Tiruthani AWS'de Amazon DataZone'da Kıdemli Ürün Yöneticisidir.

spot_img

En Son İstihbarat

spot_img