Zephyrnet Logosu

Teradata Vantage | Amazon Web Hizmetleri

Tarih:

Bu yazıda, nasıl kullanılacağını araştırıyoruz. AWS Tutkal Veri entegrasyonlarını kolaylaştırmak ve verilerinizin tüm potansiyelini ortaya çıkarmak için Teradata Vantage için yerel bağlayıcı.

İşletmeler sıklıkla güveniyor Amazon Basit Depolama Hizmeti (Amazon S3) çeşitli veri kaynaklarından büyük miktarlarda veriyi uygun maliyetli ve güvenli bir şekilde depolamak için. Veri analizi için Teradata'yı kullananlar için, Teradata Vantage için AWS Glue yerel bağlayıcısı aracılığıyla yapılan entegrasyonlar yeni olanakların kapısını aralıyor. AWS Glue, veri yönetiminin esnekliğini ve verimliliğini artırarak şirketlerin, konumundan bağımsız olarak verilerini Teradata'nın analitik yetenekleriyle sorunsuz bir şekilde entegre etmelerine olanak tanır. Bu yeni bağlayıcı, yapılandırma, güvenlik ve yönetimle ilgili teknik engelleri ortadan kaldırarak şirketlerin veri kümelerini Teradata Vantage'a zahmetsizce dışa veya içe aktarmasına olanak tanır. Sonuç olarak işletmeler, veri entegrasyonunun karmaşıklığıyla uğraşmak yerine, verilerinden anlamlı bilgiler elde etmeye daha fazla odaklanabilirler.

AWS Glue, analiz kullanıcılarının analiz, makine öğrenimi (ML) ve uygulama geliştirme için birden fazla kaynaktan verileri keşfetmesini, hazırlamasını, taşımasını ve entegre etmesini kolaylaştıran sunucusuz bir veri entegrasyon hizmetidir. AWS Glue ile 100'den fazla farklı veri kaynağını keşfedip bunlara bağlanabilir ve verilerinizi merkezi bir veri kataloğunda yönetebilirsiniz. Veri göllerinize veri yüklemek için ayıklama, dönüştürme ve yükleme (ETL) işlem hatlarını görsel olarak oluşturabilir, çalıştırabilir ve izleyebilirsiniz.

Teradata Şirketi şirketlerin tüm verilerini kuruluş genelinde geniş ölçekte kullanmalarına yardımcı olmaya odaklanan, kurumsal analitiklere yönelik önde gelen bağlantılı çoklu bulut veri platformudur. olarak AWS Veri ve Analitik Yetkinliği ortağı Teradata, Makine Öğrenimi de dahil olmak üzere eksiksiz bir bulut analitiği ve veri platformu sunuyor.

Teradata Vantage için AWS Glue yerel bağlayıcıyla tanışın

AWS Glue, hem AWS Glue Studio hem de AWS Glue ETL komut dosyaları aracılığıyla erişilebilen Teradata desteği sağlar. AWS Glue Studio ile Teradata'ya bağlanma ve AWS Glue ETL işlerini yazma, çalıştırma ve izleme sürecini kolaylaştıran görsel bir arayüzden yararlanırsınız. Veri geliştiriciler için bu destek, daha spesifik veri entegrasyonu ve dönüştürme görevleri oluşturmak ve yönetmek için Python veya Scala'yı kullanabileceğiniz AWS Glue ETL komut dosyalarını da kapsar.

Teradata Vantage için AWS Glue yerel bağlayıcısı, herhangi bir bağlayıcı kitaplığı kurmanıza veya yönetmenize gerek kalmadan Teradata'dan verileri verimli bir şekilde okumanıza ve yazmanıza olanak tanır. AWS Glue Studio'nun kodsuz, sürükle ve bırak özellikli görsel arayüzünde Teradata'yı hem kaynak hem de hedef olarak ekleyebilir veya bağlayıcıyı doğrudan bir AWS Glue ETL komut dosyası işinde kullanabilirsiniz.

Çözüme genel bakış

Bu örnekte, Amazon S3'te depolanan verileri zenginleştirmek ve Teradata Vantage'a yüklemek için AWS Glue Studio'yu kullanacaksınız. Etkinlik ve Mekan dosyalarını birleştirerek başlayın. BİLET veri kümesi. Daha sonra sonuçları tek bir coğrafi bölgeye göre filtrelersiniz. Son olarak, hassaslaştırılan verileri Teradata Vantage'a yüklersiniz.

TICKIT veri seti, kullanıcıların spor etkinlikleri, gösteriler ve konserler için çevrimiçi bilet alıp sattığı kurgusal TICKIT web sitesinin satış etkinliğini izliyor. Bu veri setinde analistler zaman içindeki bilet hareketlerini, satıcıların başarı oranlarını ve en çok satan etkinlikleri, mekanları ve sezonları tanımlayabilir.

Bu örnekte, görsel bir ETL işlem hattı geliştirmek için AWS Glue Studio'yu kullanıyorsunuz. Bu işlem hattı, Amazon S3'teki verileri okuyacak, dönüşümler gerçekleştirecek ve ardından dönüştürülen verileri Teradata'ya yükleyecektir. Aşağıdaki diyagram bu mimariyi göstermektedir.

Çözüme Genel Bakış

Bu yazının sonunda görsel ETL işiniz aşağıdaki ekran görüntüsüne benzeyecek.

Görsel ETL İş Akışı

Önkoşullar

Bu örnekte, AWS'den ağ erişilebilirliğine ve tablolar oluşturma ve verileri yükleme ve sorgulama izinlerine sahip mevcut bir Teradata veritabanı uç noktasına erişiminizin olması gerekir.

AWS Glue'nun veri okumak veya yazmak için Teradata'ya ağ erişimine ihtiyacı var. Bunun nasıl yapılandırılacağı, Teradata'nızın nereye dağıtıldığına ve belirli ağ yapılandırmasına bağlıdır. AWS'de dağıtılan Teradata için yapılandırmanız gerekebilir VPC eşlemesi or AWS Özel BağlantıAWS Glue'nun Teradata açık TCP ile iletişim kurmasına izin vermek için . Teradata AWS'nin dışındaysa aşağıdaki gibi ağ hizmetleri AWS Siteden Siteye VPN or AWS Doğrudan Bağlan gerekli olabilir. Güvenlik riskleri nedeniyle halka açık internet erişimi önerilmemektedir. Genel erişimi seçerseniz AWS Glue işini bir VPC'de bir VPC'de çalıştırmak daha güvenlidir. NAT ağ geçidi. Bu yaklaşım, ağ güvenlik duvarınızda gelen trafik için yalnızca bir IP adresini izin verilenler listesine eklemenizi sağlar. Daha fazla bilgi için bkz. AWS Glue'da altyapı güvenliği.

Amazon S3'ü kurun

Amazon S3'teki her nesne bir klasörde depolanır. Verileri Amazon S3'te depolayabilmeniz için önce şunları yapmanız gerekir: S3 paketi oluştur Sonuçları saklamak için. Aşağıdaki adımları tamamlayın:

  1. Amazon S3 konsolunda şunu seçin: Kepçeler Gezinti bölmesinde.
  2. Klinik Grup oluştur.
  3. İçin Name, paketiniz için genel olarak benzersiz bir ad girin; örneğin, Tickit8530923.
  4. Klinik Grup oluştur.
  5. Atomic Cüzdanı indirin : BİLET veri kümesini açın ve sıkıştırın.
  6. S3 klasörünüzde Tickit klasörünü oluşturun ve allevents_pipe.txt ve mekan_pipe.txt dosyalarını yükleyin.

Teradata bağlantılarını yapılandırma

AWS Glue'dan Teradata'ya bağlanmak için bkz. Teradata Bağlantısını Yapılandırma.

Teradata kimlik bilgilerinizi bir AWS Sırları Yöneticisi sırrını oluşturun ve ardından bu sırrı bir Teradata AWS Glue bağlantısıyla ilişkilendirin. Bu iki adımı bu yazının ilerleyen kısımlarında daha ayrıntılı olarak ele alacağız.

AWS Glue ETL işi için bir IAM rolü oluşturun

AWS Glue ETL işini oluşturduğunuzda, AWS Kimlik ve Erişim Yönetimi İşin kullanacağı (IAM) rolü. Rol, Amazon S3 (tüm kaynaklar, hedefler, komut dosyaları, sürücü dosyaları ve geçici dizinler için) ve Secrets Manager dahil olmak üzere iş tarafından kullanılan tüm kaynaklara erişim izni vermelidir. Talimatlar için bkz. ETL işiniz için bir IAM rolü yapılandırın.

Teradata'da tablo oluşturun

Tercih ettiğiniz veritabanı aracını kullanarak Teradata'da oturum açın. Teradata'da verilerinizi yükleyeceğiniz tabloyu oluşturmak için aşağıdaki kodu çalıştırın:

CREATE MULTISET TABLE test.tickit, FALLBACK
   (venueid varchar(25),
    venuename varchar(100),
    venuecity varchar(100),
    venuestate varchar(25),
    venueseats varchar(25),
    eventid varchar(25),
    catid varchar(25),
    dateid varchar(25),
    eventname varchar(100),
    starttime varchar(100))
    NO PRIMARY INDEX
;

Teradata oturum açma kimlik bilgilerini saklayın

An AWS Tutkal bağlantısı oturum açma kimlik bilgilerini, URI dizelerini ve daha fazlasını depolayan bir Veri Kataloğu nesnesidir. Teradata bağlayıcısı, Teradata'ya bağlanmak için kullandığınız Teradata kullanıcı adını ve parolasını depolamak için Secrets Manager'ı gerektirir.

Teradata kullanıcı adını ve parolasını Secrets Manager'da saklamak için aşağıdaki adımları tamamlayın:

  1. Secrets Manager konsolunda, sırları Gezinti bölmesinde.
  2. Klinik Yeni bir sır saklayın.
  3. seç Diğer tür sır.
  4. USER anahtarını/değerini girin ve teradata_user, Daha sonra seçmek Satır ekle.
  5. Anahtar/değer ŞİFRESİNİ girin ve teradata_user_password, Daha sonra seçmek Sonraki.

Teradata Secrets Yöneticisi Yapılandırması

  1. İçin Gizli isim, açıklayıcı bir ad girin ve ardından Sonraki.
  2. Klinik Sonraki inceleme adımına geçmek için ardından mağaza.

AWS Glue'da Teradata bağlantısını oluşturun

Artık Teradata'ya bir AWS Glue bağlantısı oluşturmaya hazırsınız. Aşağıdaki adımları tamamlayın:

  1. AWS Glue konsolunda seçin Bağlantılar altında Veri Kataloğu Gezinti bölmesinde.
  2. Klinik Bağlantı oluştur.
  3. İçin Name, bir ad girin (örneğin, teradata_connection).
  4. İçin Bağlantı türüSeç Ter veri.
  5. İçin Ter veri URL'si, girmek jdbc:teradata://url_of_teradata/database=name_of_your_database.
  6. İçin AWS Gizli, daha önce oluşturduğunuz Teradata kimlik bilgilerinizle sırrı seçin.

Teradata Bağlantısı erişimi

Verileri dönüştürmek ve Teradata'ya yüklemek için bir AWS Glue görsel ETL işi oluşturun

AWS Glue ETL işinizi oluşturmak için aşağıdaki adımları tamamlayın:

  1. AWS Tutkal konsolunda, altında ETL İşleri gezinme bölmesinde öğesini seçin. Görsel ETL.
  2. Klinik Görsel ETL.
  3. İşinize bir ad girmek için kalem simgesini seçin.

Ekleriz venue_pipe.txt ilk veri kümemiz olarak.

  1. Klinik Düğüm ekle Ve seç Amazon S3 üzerinde kaynaklar sekmesi.

Amazon S3 kaynak düğümü

  1. Aşağıdaki veri kaynağı özelliklerini girin:
    1. İçin Name, Mekan'a girin.
    2. İçin S3 kaynak türüseçin S3 konumu.
    3. İçin S3 URL'si, S3 yolunu girin venue_pipe.txt.
    4. İçin Veri formatı, seçmek CSV.
    5. İçin Sınırlayıcı, seçmek Pipe .
    6. Kaldırın Kaynak dosyanın ilk satırı sütun başlıklarını içeriyor.

S3 veri kaynağı özellikleri

Şimdi ekliyoruz allevents_pipe.txt ikinci veri setimiz olarak.

  1. Klinik Düğüm ekle Ve seç Amazon S3 üzerinde kaynaklar sekmesi.
  2. Aşağıdaki veri kaynağı özelliklerini girin:
    1. İçin Name, Etkinlik'e girin.
    2. İçin S3 kaynak türüseçin S3 konumu.
    3. İçin S3 URL'si, S3 yolunu girin allevents_pipe.txt.
    4. İçin Veri formatı, seçmek CSV.
    5. İçin Sınırlayıcı, seçmek Pipe .
    6. Kaldırın Kaynak dosyanın ilk satırı sütun başlıklarını içeriyor.

Daha sonra Venue veri kümesinin sütunlarını yeniden adlandırıyoruz.

  1. Klinik Düğüm ekle Ve seç Şemayı Değiştir üzerinde Dönüşümler sekmesi.
  2. Aşağıdaki dönüştürme özelliklerini girin:
    1. İçin Name, Mekanı Yeniden Adlandır verilerini girin.
    2. İçin Düğüm ebeveynleri, Mekan'ı seçin.
    3. içinde Şemayı Değiştir bölümünde, kaynak anahtarlarını hedef anahtarlarla eşleyin:
      1. sütun0: venueid
      2. sütun1: venuename
      3. sütun2: venuecity
      4. sütun3: venuestate
      5. sütun4: venueseats

Mekan verilerini yeniden adlandırın ETL Dönüşümü

Şimdi Venue veri kümesini belirli bir coğrafi bölgeye göre filtreliyoruz.

  1. Klinik Düğüm ekle Ve seç filtre üzerinde Dönüşümler sekmesi.
  2. Aşağıdaki dönüştürme özelliklerini girin:
    1. İçin Name, Konum Filtresi'ne girin.
    2. İçin Düğüm ebeveynleri, Mekan'ı seçin.
    3. İçin Filtre koşulu, seçmek venuestate için anahtar, seçmek maçlar için Çalışmave DC'yi girin Özellik.

Konum Filtresi Ayarları

Şimdi Etkinlik veri kümesindeki sütunları yeniden adlandırıyoruz.

  1. Klinik Düğüm ekle Ve seç Şemayı Değiştir üzerinde Dönüşümler sekmesi.
  2. Aşağıdaki dönüştürme özelliklerini girin:
    1. İçin Name, Etkinlik verilerini Yeniden Adlandır'ı girin.
    2. İçin Düğüm ebeveynleri, Etkinlik'i seçin.
    3. içinde Şemayı Değiştir bölümünde, kaynak anahtarlarını hedef anahtarlarla eşleyin:
      1. sütun0: eventid
      2. sütun1: e_venueid
      3. sütun2: catid
      4. sütun3: dateid
      5. sütun4: eventname
      6. sütun5: starttime

Daha sonra Mekan ve Etkinlik veri kümelerini birleştiriyoruz.

  1. Klinik Düğüm ekle Ve seç Kaydol üzerinde Dönüşümler sekmesi.
  2. Aşağıdaki dönüştürme özelliklerini girin:
    1. İçin Name, Katıl'a girin.
    2. İçin Düğüm ebeveynleri, Konum Filtresi'ni ve Etkinlik verilerini Yeniden Adlandır'ı seçin.
    3. İçin Birleştirme türüSeç İç birleşim.
    4. İçin Katılma koşulları, seçmek venueid için Konum Filtresi ve e_venueid için Etkinlik verilerini yeniden adlandırın.

Mülklere Katılın

Şimdi yinelenen sütunu bırakıyoruz.

  1. Klinik Düğüm ekle Ve seç Şemayı Değiştir üzerinde Dönüşümler sekmesi.
  2. Aşağıdaki dönüştürme özelliklerini girin:
    1. İçin Name, Bırak sütununa girin.
    2. İçin Düğüm ebeveynleriKatıl'ı seçin.
    3. içinde Şemayı Değiştir bölümünde, seçin Damla için e_venueid .

Sütun özelliklerini bırak

Daha sonra verileri Teradata tablosuna yüklüyoruz.

  1. Klinik Düğüm ekle Ve seç Ter veri üzerinde Hedefler sekmesi.
  2. Aşağıdaki veri havuzu özelliklerini girin:
    1. İçin Name, Teradata'ya girin.
    2. İçin Düğüm ebeveynleri, Sütunu bırak'ı seçin.
    3. İçin Ter veri bağlantısı, seçmek teradata_connection.
    4. İçin Tablo ismi, girmek schema.tablename Teradata'da oluşturduğunuz tablonun.

Veri havuzu özellikleri Teradata

Son olarak işi çalıştırıp verileri Teradata’ya yüklüyoruz.

  1. Klinik İndirim, Daha sonra seçmek koşmak.

İşin başladığını belirten bir banner görüntülenecektir.

  1. Klinik Runs, işin durumunu görüntüler.

Çalıştırma durumu olarak değişecek başarılı iş tamamlandığında.

Çalıştırma Durumu

  1. Teradata'nıza bağlanın ve ardından verilerin kendisine yüklendiği tabloyu sorgulayın.

İki veri kümesinden filtrelenen ve birleştirilen veriler tabloda yer alacaktır.

Filtrelenmiş ve birleştirilmiş veri sonucu

Temizlemek

Bu gönderinin bir parçası olarak oluşturulan kaynakların neden olduğu ek ücretlerden kaçınmak amacıyla bu gönderi için AWS hesabında oluşturduğunuz öğeleri sildiğinizden emin olun:

  • Teradata kimlik bilgileri için oluşturulan Secrets Manager anahtarı
  • Teradata Vantage için AWS Glue yerel bağlayıcısı
  • S3 klasörüne yüklenen veriler
  • AWS Glue Visual ETL işi

Sonuç

Bu gönderide, AWS Glue'yu kullanarak Teradata'ya bağlantı oluşturdunuz ve ardından verileri Teradata'ya dönüştürüp yüklemek için bir AWS Glue işi oluşturdunuz. Teradata Vantage için AWS Glue yerel bağlayıcısı, verilerinizi Teradata ile entegre etmek için sorunsuz ve etkili bir yol sağlayarak veri analizi yolculuğunuzu güçlendirir. AWS Glue'daki bu yeni özellik yalnızca veri entegrasyonu iş akışlarınızı basitleştirmekle kalmıyor, aynı zamanda gelişmiş analitik, iş zekası ve makine öğrenimi yenilikleri için yeni yollar açıyor.

AWS Teradata Connector ile veri entegrasyonu görevlerini basitleştirmek için elinizin altında en iyi araca sahipsiniz. Amazon S3 verilerini analiz, raporlama veya iş öngörüleri için Teradata'ya yüklemek istiyorsanız, bu yeni bağlayıcı süreci kolaylaştırarak daha erişilebilir ve uygun maliyetli hale getirir.

AWS Glue'yu kullanmaya başlamak için bkz. AWS Glue'ya Başlarken.


Yazarlar Hakkında

Kamen Sharlandjiev Kıdemli Büyük Veri ve ETL Çözümleri Mimarı ve AWS Glue uzmanıdır. Karmaşık veri entegrasyonu zorluklarıyla karşı karşıya kalan müşterilerin hayatını kolaylaştırma misyonundadır. Onun gizli silahı mı? İşin minimum çabayla ve kodlama gerektirmeden yapılmasını sağlayan, tam olarak yönetilen, az kodlu AWS hizmetleri. En son AWS Glue haberlerini takip etmek için Kamen'i LinkedIn'de takip edin!

Sean Bjurstrom Amazon Web Services'te ISV hesaplarında Teknik Hesap Yöneticisi olarak görev yapıyor ve burada analitik teknolojilerinde uzmanlaşıyor ve müşterilere analitik ve bulut yolculuklarında destek olmak için danışmanlık konusundaki geçmişinden yararlanıyor. Sean, işletmelerin inovasyon ve büyümeyi teşvik etmek için verilerin gücünden yararlanmasına yardımcı olma konusunda tutkulu. İş dışında koşmayı seviyor ve birçok maratona katılmış.

Vinod Jayendra Amazon Web Services'te ISV hesaplarında Kurumsal Destek Lideridir ve burada müşterilerin mimari, operasyonel ve maliyet optimizasyonu zorluklarını çözmelerine yardımcı olur. Sunucusuz teknolojilere özel olarak odaklanarak, uygulama geliştirmedeki kapsamlı geçmişinden yararlanarak müşterilerin üst düzey çözümler oluşturmasına yardımcı oluyor. İşinin ötesinde, aileyle kaliteli vakit geçirmekten, bisiklete binme maceralarına atılmaktan ve genç spor takımlarına koçluk yapmaktan keyif alıyor.

Doug Mbaya analitik ve makine öğrenimine odaklanan Kıdemli Ortak Çözüm mimarıdır. Doug, AWS iş ortaklarıyla yakın işbirliği içinde çalışıyor ve çözümlerini buluttaki AWS analitiği ve makine öğrenimi çözümleriyle entegre etmelerine yardımcı oluyor.

spot_img

En Son İstihbarat

spot_img