Zephyrnet Logosu

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri

Tarih:

Lansmanını duyurmaktan heyecan duyuyoruz Amazon DocumentDB (MongoDB uyumluluğu ile) ile entegrasyon Amazon SageMaker TuvalAmazon DocumentDB müşterilerinin kod yazmadan üretken yapay zeka ve makine öğrenimi (ML) çözümleri oluşturmasına ve kullanmasına olanak tanır. Amazon DocumentDB, altyapıyı yönetmeye gerek kalmadan kritik belge iş yüklerini neredeyse her ölçekte çalıştırmayı basit ve uygun maliyetli hale getiren, tam olarak yönetilen bir yerel JSON belge veritabanıdır. Amazon SageMaker Canvas, temel modeller de dahil olmak üzere kullanıma hazır modeller ve veri hazırlama ve özel modeller oluşturup dağıtma olanağı sunan, kodsuz bir makine öğrenimi çalışma alanıdır.

Bu yazıda Amazon DocumentDB'de depolanan verileri SageMaker Canvas'a nasıl taşıyacağımızı ve bu verileri tahmine dayalı analizler için makine öğrenimi modelleri oluşturmak amacıyla nasıl kullanacağımızı tartışıyoruz. Veri işlem hatları oluşturup bakımını yapmadan, Amazon DocumentDB'de depolanan yapılandırılmamış verilerinizle makine öğrenimi modellerini güçlendirebileceksiniz.

Çözüme genel bakış

Bir yemek dağıtım şirketinde iş analisti rolünü üstlenelim. Mobil uygulamanız, ölçeklenebilirliği ve esnek şema özellikleri nedeniyle restoranlar hakkındaki bilgileri Amazon DocumentDB'de depolar. Yeni restoranların nasıl derecelendirileceğini tahmin etmek için bu verilerle ilgili öngörü toplamak ve bir makine öğrenimi modeli oluşturmak istiyorsunuz, ancak yapılandırılmamış veriler üzerinde analiz gerçekleştirmeyi zor buluyorsunuz. Bu hedeflere ulaşmak için veri mühendisliği ve veri bilimi ekiplerine güvenmeniz gerektiğinden darboğazlarla karşılaşırsınız.

Bu yeni entegrasyon, Amazon DocumentDB verilerini SageMaker Canvas'a taşımayı ve verileri makine öğrenimi için hazırlamaya ve analiz etmeye hemen başlamayı basitleştirerek bu sorunları çözüyor. Ayrıca SageMaker Canvas, yüksek kaliteli modeller oluşturmak ve tahminler oluşturmak için makine öğrenimi uzmanlığına olan bağımlılığı ortadan kaldırır.

SageMaker Canvas'ta makine öğrenimi modelleri oluşturmak için Amazon DocumentDB verilerinin nasıl kullanılacağını aşağıdaki adımlarda gösteriyoruz:

  1. SageMaker Canvas'ta bir Amazon DocumentDB bağlayıcısı oluşturun.
  2. Üretken yapay zekayı kullanarak verileri analiz edin.
  3. Verileri makine öğrenimi için hazırlayın.
  4. Bir model oluşturun ve tahminler oluşturun.

Önkoşullar

Bu çözümü uygulamak için aşağıdaki önkoşulları tamamlayın:

  1. AWS Cloud yönetici erişimine sahip olun AWS Kimlik ve Erişim Yönetimi (BEN) kullanıcı Entegrasyonu tamamlamak için gerekli izinlere sahip.
  2. kullanarak ortam kurulumunu tamamlayın. AWS CloudFormation aşağıdaki seçeneklerden herhangi birini kullanarak:
    1. CloudFormation şablonunu yeni bir VPC'ye dağıtın – Bu seçenek, VPC, özel alt ağlar, güvenlik grupları, IAM yürütme rollerinden oluşan yeni bir AWS ortamı oluşturur. Amazon Bulut9, gerekli VPC uç noktaları, ve SageMaker etki alanı. Daha sonra Amazon DocumentDB'yi bu yeni VPC'ye dağıtır. İndir şablon veya CloudFormation yığınını seçerek hızlı bir şekilde başlatın. Yığını Başlat:
      CloudFormation yığınını başlat
    2. CloudFormation şablonunu mevcut bir VPC'ye dağıtın – Bu seçenek, özel alt ağlara sahip mevcut bir VPC'de gerekli VPC uç noktalarını, IAM yürütme rollerini ve SageMaker etki alanını oluşturur. İndir şablon veya CloudFormation yığınını seçerek hızlı bir şekilde başlatın. Yığını Başlat:
      CloudFormation yığınını başlat

Yeni bir SageMaker etki alanı oluşturuyorsanız bağlayıcıyı Amazon DocumentDB'ye ekleyebilmek için etki alanını internet erişimi olmayan özel bir VPC'de olacak şekilde yapılandırmanız gerektiğini unutmayın. Daha fazla bilgi edinmek için bkz. Amazon SageMaker Canvas'ı internet erişimi olmayan bir VPC'de yapılandırma.

  1. Izleyin öğretici Örnek restoran verilerini Amazon DocumentDB'ye yüklemek için.
  2. Amazon Bedrock'a ve içindeki Antropik Claude modeline erişim ekleyin. Daha fazla bilgi için bakınız Model erişimi ekle.

SageMaker Canvas'ta bir Amazon DocumentDB bağlayıcısı oluşturun

SageMaker alan adınızı oluşturduktan sonra aşağıdaki adımları tamamlayın:

  1. Amazon DocumentDB konsolunda şunu seçin: Kodsuz makine öğrenimi Gezinti bölmesinde.
  2. Altında Bir alan adı ve profil seçin¸ SageMaker alanınızı ve kullanıcı profilinizi seçin.
  3. Klinik Tuvali Başlat SageMaker Canvas'ı yeni bir sekmede başlatmak için.

SageMaker Canvas yüklemeyi tamamladığında, Veri akışları sekmesi.

  1. Klinik oluşturmak yeni bir veri akışı oluşturmak için.
  2. Veri akışınız için bir ad girin ve oluşturmak.
  3. seçeneğini belirleyerek yeni bir Amazon DocumentDB bağlantısı ekleyin Tarihleri ​​içe aktar, Daha sonra seçmek çizelge halinde için Veri kümesi türü.
  4. Üzerinde Tarihleri ​​içe aktar sayfası, için Veri kaynağı, seçmek DocumentDB ve Bağlantı Ekle.
  5. Demo gibi bir bağlantı adı girin ve istediğiniz Amazon DocumentDB kümesini seçin.

SageMaker Canvas'ın açılır menüyü, SageMaker alanınızla aynı VPC'deki kümelerle önceden dolduracağını unutmayın.

  1. Bir kullanıcı adı, parola ve veritabanı adı girin.
  2. Son olarak okuma tercihinizi seçin.

Birincil örneklerin performansını korumak için SageMaker Canvas varsayılan olarak ikincilBu, yalnızca ikincil örneklerden okuyacağı anlamına gelir. Okuma tercihi olduğunda İkincil tercih, SageMaker Canvas mevcut ikincil örneklerden okur, ancak ikincil bir örnek mevcut değilse birincil örnekten okur. Amazon DocumentDB bağlantısının nasıl yapılandırılacağı hakkında daha fazla bilgi için bkz. AWS'de depolanan bir veritabanına bağlanın.

  1. Klinik Bağlantı ekle.

Bağlantı başarılı olursa Amazon DocumentDB veritabanınızdaki koleksiyonların tablolar halinde gösterildiğini göreceksiniz.

  1. Seçtiğiniz tabloyu boş tuvale sürükleyin. Bu gönderi için restoran verilerimizi ekliyoruz.

İlk 100 satır önizleme olarak görüntülenir.

  1. Verilerinizi analiz etmeye ve hazırlamaya başlamak için Tarihleri ​​içe aktar.
  2. Bir veri kümesi adı girin ve seçin Tarihleri ​​içe aktar.

Üretken yapay zeka kullanarak verileri analiz edin

Daha sonra, verilerimiz hakkında bazı bilgiler edinmek ve kalıplar aramak istiyoruz. SageMaker Canvas, verileri analiz etmek ve hazırlamak için doğal bir dil arayüzü sağlar. Ne zaman Veri sekme yüklendiğinde, aşağıdaki adımlarla verilerinizle sohbet etmeye başlayabilirsiniz:

  1. Klinik Veri hazırlığı için sohbet edin.
  2. Aşağıdaki ekran görüntülerinde gösterilen örneklere benzer sorular sorarak verileriniz hakkında bilgi toplayın.

Verileri keşfetmek ve hazırlamak için doğal dilin nasıl kullanılacağı hakkında daha fazla bilgi edinmek için bkz. Amazon SageMaker Canvas'ın yeni özelliğiyle verileri keşfetmek ve hazırlamak için doğal dili kullanın.

Veri kalitesini otomatik olarak değerlendiren ve anormallikleri tespit eden SageMaker Canvas Veri Kalitesi ve Öngörüler Raporunu kullanarak veri kalitemiz hakkında daha derin bir fikir edinelim.

  1. Üzerinde analizler sekmesini seçin Veri Kalitesi ve Öngörüler Raporu.
  2. Klinik rating hedef sütun olarak ve Gerileme sorun türü olarak seçin, ardından oluşturmak.

Bu, model eğitimini simüle edecek ve makine öğrenimi için verilerimizi nasıl geliştirebileceğimize dair bilgiler sağlayacaktır. Raporun tamamı birkaç dakika içinde oluşturulur.

Raporumuz, hedefimizdeki satırların %2.47'sinin eksik değerlere sahip olduğunu gösteriyor; bunu bir sonraki adımda ele alacağız. Ek olarak, analiz şunu gösteriyor: address line 2, name, ve type_of_food özellikler verilerimizde en fazla tahmin gücüne sahiptir. Bu, konum ve mutfak gibi temel restoran bilgilerinin derecelendirmeler üzerinde çok büyük bir etkiye sahip olabileceğini gösteriyor.

Verileri makine öğrenimi için hazırlama

SageMaker Canvas, içe aktarılan verilerinizi hazırlamak için 300'den fazla yerleşik dönüşüm sunar. SageMaker Canvas'ın dönüştürme özellikleri hakkında daha fazla bilgi için bkz. Gelişmiş dönüşümlerle verileri hazırlayın. Verilerimizi bir ML modelini eğitmeye hazır hale getirmek için bazı dönüşümler ekleyelim.

  1. Geri gidin Veri akışı sayfanın üst kısmında veri akışınızın adını seçerek sayfa.
  2. yanındaki artı işaretini seçin Veri tipleri Ve seç Dönüşüm ekle.
  3. Klinik Adım ekle.
  4. yeniden adlandıralım address line 2 sütun cities.
    1. Klinik Sütunları yönet.
    2. Klinik Sütunu yeniden adlandır için Dönüştürmek.
    3. Klinik address line 2 için Giriş sütunu, girmek cities için Yeni isim, ve Seç Ekle.
  5. Ek olarak, bazı gereksiz sütunları da bırakalım.
    1. Yeni bir dönüşüm ekleyin.
    2. İçin Dönüştürmek, seçmek Sütunu bırak.
    3. İçin Bırakılacak sütunlar, seçmek URL ve restaurant_id.
    4. Klinik Ekle.
      [
  6. nen rating özellik sütununda bazı eksik değerler var, bu nedenle bu satırları bu sütunun ortalama değeriyle dolduralım.
    1. Yeni bir dönüşüm ekleyin.
    2. İçin Dönüştürmek, seçmek Atfetmek.
    3. İçin Sütun türü, seçmek Sayısal.
    4. İçin Giriş sütunları, seç rating sütun.
    5. İçin Yükleme stratejisi, seçmek Anlamına gelmek.
    6. İçin Çıktı sütunu, girmek rating_avg_filled.
    7. Klinik Ekle.
  7. bırakabiliriz rating sütun çünkü doldurulmuş değerlere sahip yeni bir sütunumuz var.
  8. Çünkü type_of_food doğası gereği kategorik olduğundan, onu sayısal olarak kodlamak isteyeceğiz. Bu özelliği one-hot kodlama tekniğini kullanarak kodlayalım.
    1. Yeni bir dönüşüm ekleyin.
    2. İçin Dönüştürmek, seçmek Tek sıcak kodlama.
    3. Giriş sütunları için şunu seçin: type_of_food.
    4. İçin Geçersiz işleme stratejisiSeç tutmak.
    5. İçin Çıktı stiliSeç Sütunlar.
    6. İçin Çıktı sütunu, girmek encoded.
    7. Klinik Ekle.

Bir model oluşturun ve tahminler oluşturun

Artık verilerimizi dönüştürdüğümüze göre, restoranların derecelendirmelerini tahmin etmek için sayısal bir makine öğrenimi modeli eğitelim.

  1. Klinik Model oluştur.
  2. İçin Veri kümesi adıveri kümesi dışa aktarımı için bir ad girin.
  3. Klinik Ihracat ve dönüştürülen verilerin dışa aktarılmasını bekleyin.
  4. Seçin Model oluştur sayfanın sol alt köşesindeki bağlantı.

Veri kümesini sayfanın solundaki Veri Wrangler özelliğinden de seçebilirsiniz.

  1. Bir model adı girin.
  2. Klinik Tahmine dayalı analiz, Daha sonra seçmek oluşturmak.
  3. Klinik rating_avg_filled hedef sütun olarak

SageMaker Canvas uygun bir model tipini otomatik olarak seçer.

  1. Klinik Önizleme modeli Veri kalitesi sorunları olmadığından emin olmak için.
  2. Klinik Hızlı inşa modeli oluşturmak için.

Model oluşturmanın tamamlanması yaklaşık 2-15 dakika sürecektir.

Model eğitimi tamamladıktan sonra model durumunu görüntüleyebilirsiniz. Modelimizin RSME'si 0.422'dir; bu, modelin genellikle bir restoranın derecelendirmesini gerçek değerin +/- 0.422'si dahilinde tahmin ettiği anlamına gelir; bu, 1-6 arası derecelendirme ölçeği için sağlam bir yaklaşımdır.

  1. Son olarak şuraya giderek örnek tahminler oluşturabilirsiniz: Tahmin sekmesi.

Temizlemek

Gelecekte masraf oluşmasını önlemek için bu gönderiyi takip ederken oluşturduğunuz kaynakları silin. SageMaker Canvas, oturum süresi boyunca size fatura keser ve kullanmadığınız zamanlarda SageMaker Canvas'tan çıkış yapmanızı öneririz. Bakınız Amazon SageMaker Canvas oturumunu kapatma daha fazla ayrıntı için.

Sonuç

Bu yazıda, Amazon DocumentDB'de depolanan verilerle üretken yapay zeka ve makine öğrenimi için SageMaker Canvas'ı nasıl kullanabileceğinizi tartıştık. Örneğimizde, bir analistin örnek bir restoran veri kümesini kullanarak nasıl hızlı bir şekilde yüksek kaliteli bir makine öğrenimi modeli oluşturabileceğini gösterdik.

Amazon DocumentDB'den veri içe aktarmaktan SageMaker Canvas'ta makine öğrenimi modeli oluşturmaya kadar çözümü uygulamaya yönelik adımları gösterdik. Tüm süreç görsel bir arayüz üzerinden tek satır kod yazılmadan tamamlandı.

Düşük kodlu/kodsuz makine öğrenimi yolculuğunuza başlamak için bkz. Amazon SageMaker Tuval.


yazarlar hakkında

Adeleke Çoker AWS'li bir Global Çözüm Mimarıdır. AWS'de üretim iş yüklerini uygun ölçekte dağıtma konusunda rehberlik ve teknik yardım sağlamak için dünya çapındaki müşterilerle birlikte çalışır. Boş zamanlarında öğrenmekten, okumaktan, oyun oynamaktan ve spor müsabakalarını izlemekten hoşlanır.

Gururaj S Bayari AWS'de Kıdemli DocumentDB Uzman Çözüm Mimarıdır. Müşterilerin Amazon'un amaca yönelik olarak oluşturulmuş veritabanlarını benimsemelerine yardımcı olmaktan hoşlanıyor. Müşterilerin NoSQL ve/veya İlişkisel veritabanları tarafından desteklenen internet ölçeklerini ve yüksek performanslı iş yüklerini tasarlamalarına, değerlendirmelerine ve optimize etmelerine yardımcı olur.

Tim Pusateri AWS'de Kıdemli Ürün Yöneticisidir ve Amazon SageMaker Canvas üzerinde çalışmaktadır. Amacı, müşterilerin AI/ML'den hızlı bir şekilde değer elde etmesine yardımcı olmaktır. İş dışında dışarıda olmayı, gitar çalmayı, canlı müzik izlemeyi, ailesi ve arkadaşlarıyla vakit geçirmeyi seviyor.

Pratik Das AWS'de Ürün Yöneticisidir. Bulutta dayanıklı iş yükleri ve güçlü veri temelleri oluşturmak isteyen müşterilerle çalışmaktan hoşlanıyor. Modernizasyon, analitik ve veri dönüşümü girişimleri konusunda işletmelerle çalışarak uzmanlığını getiriyor.

Varma Gottumukkala Dallas Fort Worth merkezli AWS'de Kıdemli Veritabanı Uzmanı Çözüm Mimarıdır. Varma, müşterilerle birlikte veritabanı stratejileri üzerinde çalışıyor ve AWS'nin amacına uygun olarak oluşturulmuş veritabanlarını kullanarak iş yüklerinin mimarisini oluşturuyor. AWS'ye katılmadan önce son 22 yıldır ilişkisel veritabanları, NOSQL veritabanları ve birden fazla programlama dili üzerinde yoğun bir şekilde çalıştı.

spot_img

En Son İstihbarat

spot_img