Zephyrnet Logosu

Amazon SageMaker JumpStart'ı kullanarak Üretken Yapay Zeka ve RAG ile güvenli bir kurumsal uygulama oluşturun | Amazon Web Hizmetleri

Tarih:

Üretken yapay zeka, konuşmalar, hikayeler, resimler, videolar ve müzik dahil olmak üzere yeni içerik ve fikirler yaratabilen bir yapay zeka türüdür. Çok miktarda veri üzerinde önceden eğitilmiş ve genellikle temel modeller (FM'ler) olarak adlandırılan büyük dil modelleri (LLM'ler) tarafından desteklenmektedir.

Bu Yüksek Lisans veya FM'lerin ortaya çıkışıyla müşteriler reklam, bilgi yönetimi ve müşteri desteği için basitçe Üretken AI tabanlı uygulamalar geliştirebilirler. Bu uygulamaların etkisinin farkına varılması, müşterilere gelişmiş içgörüler sağlayabilir ve kolay bilgi alımı ve belirli zaman alıcı görevlerin otomatikleştirilmesiyle kuruluştaki performans verimliliğini olumlu yönde etkileyebilir.

AWS'deki üretken yapay zeka ile uygulamalarınızı yeniden keşfedebilir, tamamen yeni müşteri deneyimleri oluşturabilir ve genel üretkenliği artırabilirsiniz.

Bu yazıda, kullanarak güvenli bir kurumsal uygulama geliştiriyoruz. AWS Yükseltme bu bir çağrıştırır Amazon SageMaker Hızlı Başlangıç temel modeli, Amazon Adaçayı Yapıcı uç noktalar ve Amazon Açık Arama Hizmeti metinden metne veya metinden resme ve Erişim Artırılmış Üretimin (RAG) nasıl oluşturulacağını açıklamak. AWS hizmetlerini kullanarak Üretken Yapay Zeka alanında güvenli kurumsal uygulamalar oluşturmak için bu gönderiyi referans olarak kullanabilirsiniz.

Çözüme genel bakış

Bu çözüm, metinden metne, metinden görüntüye ve metin yerleştirme modellerini SageMaker uç noktaları olarak dağıtmak için SageMaker JumpStart modellerini kullanır. Bu SageMaker uç noktaları Amplify React uygulamasında şu şekilde tüketilir: Amazon API Ağ Geçidi ve AWS Lambda işlevler. Uygulamayı ve API'leri yanlışlıkla erişime karşı korumak için, Amazon Cognito'su Amplify React, API Gateway ve Lambda işlevlerine entegre edilmiştir. SageMaker uç noktaları ve Lambda, özel VPCBöylece API Gateway'den Lambda işlevlerine olan iletişim, API Gateway VPC bağlantıları kullanılarak korunur. Aşağıdaki iş akışı şeması bu çözümü göstermektedir.

İş akışı aşağıdaki adımları içerir:

  1. İlk kurulum: SageMaker JumpStart FM'ler, SageMaker JumpStart modellerinden oluşturulan üç uç noktayla SageMaker uç noktaları olarak dağıtılır. Metinden görüntüye modeli, görüntü oluşturmak için kullanılacak bir Stabilite Yapay Zeka Kararlı Yayılma temel modelidir. Metin oluşturmak için kullanılan ve çözümde kullanılan metinden metne modeli, Hugging Face Flan T5 XL modelidir. Amazon OpenSearch Hizmetinde dizine eklenecek yerleştirme oluşturmak veya gelen soruya ilişkin bağlamı aramak için kullanılacak metin yerleştirme modeli, Hugging Face GPT 6B FP16 yerleştirme modelidir. Kullanım senaryosu ve model performans kriterlerine göre alternatif LLM'ler dağıtılabilir. Temel modelleri hakkında daha fazla bilgi için bkz. Amazon SageMaker JumpStart'ı kullanmaya başlarken.
  2. React uygulamasına bilgisayarınızdan erişirsiniz. React uygulamasının üç sayfası vardır: görüntü istemlerini alan ve oluşturulan görüntüyü görüntüleyen bir sayfa; metin istemlerini alan ve oluşturulan metni görüntüleyen bir sayfa; ve bir soruyu alan, soruyla eşleşen bağlamı bulan ve metinden metne modeli tarafından oluşturulan yanıtı görüntüleyen bir sayfa.
  3. Amplify kitaplıkları kullanılarak oluşturulan React uygulaması Amplify'da barındırılır ve kullanıcıya Amplify ana bilgisayar URL'sinde sunulur. Amplify, React uygulaması için barındırma ortamı sağlar. Amplify CLI, Amplify barındırma ortamını önyüklemek ve kodu Amplify barındırma ortamına dağıtmak için kullanılır.
  4. Kimliğiniz doğrulanmadıysa Amplify React UI kitaplığı kullanılarak Amazon Cognito'ya karşı kimliğiniz doğrulanır.
  5. Bir giriş sağladığınızda ve formu gönderdiğinizde istek API Gateway aracılığıyla işlenir.
  6. Lambda işlevleri kullanıcı girişini temizler ve ilgili SageMaker uç noktalarını çağırır. Lambda işlevleri ayrıca, arındırılmış kullanıcı girişinden gelen istemleri LLM tarafından beklenen ilgili formatta oluşturur. Bu Lambda işlevleri aynı zamanda LLM'lerden gelen çıktıyı yeniden biçimlendirir ve yanıtı kullanıcıya geri gönderir.
  7. SageMaker uç noktaları, metinden metne (Flan T5 XXL), metinden yerleştirmelere (GPTJ-6B) ve metinden görüntüye modeller (Stability AI) için dağıtılır. Önerilen varsayılan SageMaker bulut sunucusu türlerini kullanan üç ayrı uç nokta dağıtılır.
  8. Belgelere yönelik yerleştirmeler, metinden yerleştirmelere modeli kullanılarak oluşturulur ve bu yerleştirmeler OpenSearch Hizmetinde indekslenir. OpenSearch Hizmetinden yerleştirmelerin aranmasına izin vermek için bir k-En Yakın Komşu (k-NN) dizini etkinleştirilir.
  9. An AWS Fargate job, belgeleri alır ve bunları daha küçük paketlere ayırır, metinden gömmelere LLM modelini çağırır ve döndürülen yerleştirmeleri, daha önce açıklandığı gibi arama bağlamı için OpenSearch Hizmetine indeksler.

Veri kümesine genel bakış

Bu çözüm için kullanılan veri kümesi pile-of-law içinde Sarılma Yüz deposu. Bu veri kümesi, geniş bir hukuki ve idari veri kümesidir. Bu örnek için şunu kullanıyoruz: train.cc_casebooks.jsonl.xz bu deponun içinde. Bu, LLM'lerin gerektirdiği şekilde JSONL formatında hazırlanmış bir eğitim vaka kitapları koleksiyonudur.

Önkoşullar

Başlamadan önce, aşağıdaki ön koşullara sahip olduğunuzdan emin olun:

Çözümü uygula

Tüm mimari bileşenleri içeren bir AWS CDK projesi bu AWS Örneklerinde kullanıma sunulmuştur GitHub deposu. Bu çözümü uygulamak için aşağıdakileri yapın:

  1. klonlamak GitHub deposu bilgisayarınıza.
  2. Kök klasöre gidin.
  3. Python sanal ortamını başlatın.
  4. Belirtilen gerekli bağımlılıkları yükleyin. requirements.txt dosyası.
  5. AWS CDK'yi proje klasöründe başlatın.
  6. Proje klasöründeki Bootstrap AWS CDK'si.
  7. AWS CDK konuşlandırma komutunu kullanarak yığınları dağıtın.
  8. Proje klasörü içindeki Amplify klasörüne gidin.
  9. Amplify'ı başlatın ve CLI tarafından sağlanan varsayılanları kabul edin.
  10. Hosting'i güçlendirin.
  11. Amplify ön ucunu Amplify klasörü içinden yayınlayın ve çalıştırmanın sonunda sağlanan alan adını not edin.
  12. Amazon Cognito konsolunda, dağıtımla sağlanan Amazon Cognito örneğine bir kullanıcı ekleyin.
  13. 11. adımdaki alan adına gidin ve uygulamaya erişmek için Amazon Cognito oturum açma ayrıntılarını sağlayın.

OpenSearch indeksleme işini tetikleyin

AWS CDK projesi adlı bir Lambda işlevini devreye aldı. GenAIServiceTxt2EmbeddingsOSIndexingLambda. Lambda konsolunda bu işleve gidin.

Aşağıdaki ekran görüntüsünde gösterildiği gibi boş bir veriyle bir test çalıştırın.

Bu Lambda işlevi, bir Fargate görevini tetikler. Amazon Elastik Konteyner Hizmeti (Amazon ECS) VPC içinde çalışıyor. Bu Fargate görevi, dahil edilen JSONL dosyasını bölümlere ayırıp bir yerleştirme dizini oluşturur. Her segmentin yerleştirilmesi, AWS CDK projesinin bir parçası olarak dağıtılan metinden yerleştirmeye LLM uç noktasının çağrılmasının bir sonucudur.

Temizlemek

Gelecekteki masraflardan kaçınmak için SageMaker uç noktasını silin ve tüm Lambda işlevlerini durdurun. Ayrıca Amazon S3'te uygulama iş akışını çalıştırırken oluşturduğunuz çıktı verilerini de silin. Demetleri silebilmeniz için önce S3 demetlerindeki verileri silmelisiniz.

Sonuç

Bu gönderide, Üretken Yapay Zeka ve RAG kullanarak güvenli bir kurumsal uygulama oluşturmak için uçtan uca bir yaklaşım gösterdik. Bu yaklaşım, AWS'de güvenli ve ölçeklenebilir Üretken Yapay Zeka uygulamalarının oluşturulmasında kullanılabilir. AWS CDK uygulamasını hesabınıza dağıtmanızı ve Üretken Yapay Zeka çözümünü oluşturmanızı öneririz.

Ek kaynaklar

AWS'deki Üretken Yapay Zeka uygulamaları hakkında daha fazla bilgi için aşağıdakilere bakın:


Yazarlar Hakkında

Jay Pillai Amazon Web Services'te Baş Çözüm Mimarıdır. Bilgi Teknolojisi Lideri olarak Jay, yapay zeka, veri entegrasyonu, iş zekası ve kullanıcı arayüzü alanlarında uzmanlaşmıştır. Gayrimenkul, finansal hizmetler, sigorta, ödemeler ve pazar araştırması iş alanlarında çok sayıda müşteriyle çalışma konusunda 23 yıllık kapsamlı deneyime sahiptir.

Şihar Kwatra Amazon Web Services'ta önde gelen bir Küresel Sistem Entegratörü ile çalışan bir AI/ML Uzman Çözüm Mimarıdır. AI/ML ve IoT alanlarında 500'den fazla patentle Hindistan'ın En Genç Usta Mucitlerinden biri unvanını kazandı. Shikhar, kuruluş için uygun maliyetli, ölçeklenebilir bulut ortamlarının mimarisine, oluşturulmasına ve sürdürülmesine yardımcı olur ve AWS'de stratejik endüstri çözümleri oluşturma konusunda GSI iş ortağını destekler. Shikhar, boş zamanlarında gitar çalmaktan, müzik bestelemekten ve farkındalık egzersizlerinden hoşlanıyor.

Karthik Sonti Ortak müşterilerimizin işlerini AWS'de farklı bir şekilde dönüştürmelerine yardımcı olmak için Accenture ile yatay, işlevsel ve dikey çözümleri kavramsallaştırmaya, oluşturmaya ve başlatmaya odaklanan küresel bir çözüm mimarları ekibine liderlik etmektedir.

spot_img

En Son İstihbarat

spot_img