Zephyrnet Logosu

Amazon Bedrock'taki Cohere temel modelleri ve AWS Marketplace'teki Weaviate vektör veritabanıyla kurumsal kullanıma hazır üretken yapay zeka çözümleri oluşturun | Amazon Web Hizmetleri

Tarih:

Üretken yapay zeka çözümleri Verimliliği artırarak ve müşteri deneyimlerini iyileştirerek işletmeleri dönüştürme potansiyeline sahip ve bu çözümlerle birlikte büyük dil modellerinin (LLM'ler) kullanılması giderek daha popüler hale geldi. Konsept kanıtları oluşturmak nispeten basittir çünkü son teknoloji temel modelleri basit bir API çağrısıyla uzman sağlayıcılardan edinilebilir. Bu nedenle, farklı boyutlardaki ve farklı sektörlerdeki kuruluşlar, üretken yapay zekayı kullanarak ürünlerini ve süreçlerini yeniden tasarlamaya başladı.

Genel bilgi zenginliğine rağmen, en son teknolojiye sahip LLM'ler yalnızca eğitim aldıkları bilgilere erişebilirler. Bu, LLM'den eğitimleri sırasında görmedikleri bilgilere dayalı olarak metin oluşturması istendiğinde gerçek yanlışlıklara (halüsinasyonlara) yol açabilir. Bu nedenle, modelin halüsinasyon riskini azaltırken daha doğru ve bağlamsal yanıtlar oluşturmasına yardımcı olmak için LLM'nin genel bilgisi ile özel verileriniz arasındaki boşluğu kapatmak çok önemlidir. Geleneksel ince ayar yöntemi etkili olmasına rağmen yoğun bilgi işlem gerektirebilir, pahalı olabilir ve teknik uzmanlık gerektirir. Göz önünde bulundurulması gereken başka bir seçenek denir Erişim Artırılmış Nesil (RAG)LLM'lere harici bir bilgi kaynağından kolayca güncellenebilecek ek bilgiler sağlayan.

Ayrıca işletmelerin, kişisel veriler veya fikri mülkiyet hakları gibi özel ve hassas verileri işlerken veri güvenliğini sağlaması gerekir. Bu özellikle finansal hizmetler, sağlık hizmetleri ve yaşam bilimleri gibi sıkı düzenlemeye tabi sektörlerde faaliyet gösteren kuruluşlar için önemlidir. Bu nedenle üretken yapay zeka uygulaması aracılığıyla verilerinizin akışını anlamak ve kontrol etmek önemlidir: Model nerede bulunuyor? Veriler nerede işleniyor? Verilere kimin erişimi var? Veriler modelleri eğitmek için kullanılacak ve sonuçta hassas verilerin halka açık Yüksek Lisans'lara sızması riskiyle karşı karşıya mı kalınacak?

Bu gönderide işletmelerin özel veriler üzerinde tam kontrolü korurken nasıl doğru, şeffaf ve güvenli üretken yapay zeka uygulamaları geliştirebilecekleri tartışılıyor. Önerilen çözüm, sonradan akla gelen bir düşünce olarak eklenen yapay zeka yetenekleri yerine, bileşenleri özünde yapay zeka ile sıfırdan tasarlanan, yapay zekaya özgü bir teknoloji yığını kullanan bir RAG boru hattıdır. kullanarak uçtan uca bir RAG uygulamasının nasıl oluşturulacağını gösteriyoruz. Cohere'in dil modelleri içinden Amazon Ana Kayası ve AWS Marketplace'te Weaviate vektör veritabanı. Ekteki kaynak kodu şurada mevcuttur: ilgili GitHub deposu Weaviate'in ev sahipliğinde. AWS, iş ortağının deposundaki kodun bakımı veya güncellenmesinden sorumlu olmasa da, müşterilerin istenen güncellemelerle ilgili olarak doğrudan Weaviate ile bağlantı kurmasını teşvik ediyoruz.

Çözüme genel bakış

Aşağıdaki üst düzey mimari şeması, doğru, şeffaf ve güvenli üretken yapay zeka çözümleri oluşturmak için yapay zekaya özgü bir teknoloji yığınına sahip önerilen RAG boru hattını göstermektedir.

Şekil 1: Amazon Bedrock aracılığıyla Cohere'in dil modellerini ve AWS Marketplace'teki Weaviate vektör veritabanını kullanan RAG iş akışı

RAG iş akışına yönelik bir hazırlık adımı olarak, harici bilgi kaynağı olarak hizmet veren bir vektör veritabanı, özel verilerden gelen ek bağlamla birlikte alınır. Gerçek RAG iş akışı şemada gösterilen dört adımı takip eder:

  1. Kullanıcı sorgusunu girer.
  2. Kullanıcı sorgusu, vektör veritabanından ilgili ek bağlamı almak için kullanılır. Bu, veritabanından en alakalı bağlamı almak üzere bir vektör araması gerçekleştirmek için kullanıcı sorgusunun vektör yerleştirmelerinin bir gömme modeliyle oluşturulmasıyla yapılır.
  3. Alınan içerik ve kullanıcı sorgusu, bilgi istemi şablonunu genişletmek için kullanılır. Geri getirmeyle güçlendirilmiş istem, LLM'nin halüsinasyonları en aza indirerek daha ilgili ve doğru bir tamamlama oluşturmasına yardımcı olur.
  4. Kullanıcı sorgusuna göre daha doğru bir yanıt alır.

Mimari diyagramda gösterilen yapay zekaya özgü teknoloji yığınının iki temel bileşeni vardır: Cohere dil modelleri ve Weaviate vektör veritabanı.

Amazon Bedrock'ta tutarlı dil modelleri

The Tutarlı Platform Basit bir API çağrısı aracılığıyla kuruluşlara ve geliştiricilere son teknoloji performansa sahip dil ​​modelleri getiriyor. Cohere Platformunun sağladığı iki temel dil işleme yeteneği türü vardır (üretken ve yerleştirme) ve her biri farklı türde bir model tarafından sunulur:

  • Metin oluşturma ile Komuta – Geliştiriciler, konuşma, soru yanıtlama, metin yazarlığı, özetleme, bilgi çıkarma ve daha fazlası gibi uygulamaları etkinleştirerek üretken yapay zeka yeteneklerini güçlendiren uç noktalara erişebilir.
  • Metin gösterimi ile Gömmek – Geliştiriciler, metnin anlamsal anlamını yakalayan uç noktalara erişerek vektör arama motorları, metin sınıflandırması ve kümeleme gibi uygulamaları etkinleştirebilir. Cohere Embed, İngilizce dil modeli ve çok dilli model olmak üzere iki biçimde gelir; her ikisi de artık Amazon Bedrock'ta mevcut.

Cohere Platformu, işletmelerin üretken yapay zeka çözümlerini Amazon Bedrock dağıtımı aracılığıyla özel ve güvenli bir şekilde özelleştirmelerine olanak tanır. Amazon Bedrock, geliştirme ekiplerinin üretken yapay zeka uygulamalarını hızlı bir şekilde oluşturup ölçeklendirmesine olanak tanıyan, tam olarak yönetilen bir bulut hizmetidir verilerinizin ve uygulamalarınızın güvenli ve gizli kalmasına yardımcı olurken. Verileriniz hizmet iyileştirmeleri için kullanılmaz, hiçbir zaman üçüncü taraf model sağlayıcılarla paylaşılmaz ve Bölge API çağrısının işlendiği yer. Veriler her zaman aktarım sırasında ve beklemedeyken şifrelenir ve verileri kendi anahtarlarınızı kullanarak şifreleyebilirsiniz. Amazon Bedrock, ABD Sağlık Sigortası Taşınabilirlik ve Sorumluluk Yasası (HIPAA) uygunluğu ve Genel Veri Koruma Yönetmeliği (GDPR) uyumluluğu dahil olmak üzere güvenlik gereksinimlerini destekler. Ek olarak, halihazırda aşina olduğunuz AWS araçlarını kullanarak üretken yapay zeka uygulamalarınızı güvenli bir şekilde entegre edebilir ve kolayca dağıtabilirsiniz.

AWS Marketplace'te Weaviate vektör veritabanı

dokuma bir Yapay zeka yerlisi vektör veritabanı bu, geliştirme ekiplerinin güvenli ve şeffaf üretken yapay zeka uygulamaları oluşturmasını kolaylaştırır. Weaviate, hem vektör verilerini hem de kaynak nesneleri depolamak ve aramak için kullanılır; bu, ayrı veritabanlarını barındırma ve entegre etme ihtiyacını ortadan kaldırarak geliştirmeyi basitleştirir. Weaviate, saniyenin altında anlamsal arama performansı sunar ve milyarlarca vektörü ve milyonlarca kiracıyı işleyecek şekilde ölçeklenebilir. Benzersiz bir şekilde genişletilebilir mimariye sahip Weaviate, verilerin uygun şekilde vektörleştirilmesini kolaylaştırmak ve veri tabanı içinden üretken yeteneklerini kullanmak için Amazon Bedrock'ta konuşlandırılan Cohere temel modelleriyle yerel olarak entegre olur.

Weaviate AI-yerel vektör veritabanı, müşterilere bunu kendi bulutunu getir (BYOC) çözümü veya yönetilen bir hizmet olarak dağıtma esnekliği sağlar. Bu vitrin şunları kullanır: AWS Marketplace'te Kubernetes Kümesini Weaviate EdinWeaviate'in BYOC teklifinin bir parçası olup, AWS kiracınız ve VPC'niz içinde yalnızca birkaç tıklamayla konteyner tabanlı ölçeklenebilir dağıtıma olanak tanır. AWS CloudFormation şablon. Bu yaklaşım, gecikmeyi en aza indirmek, veri yerelliğini desteklemek ve GDPR gibi potansiyel düzenleyici gereksinimleri karşılarken hassas verileri korumak için vektör veritabanınızın belirli Bölgenizde temel modellere ve özel verilere yakın bir yerde konuşlandırılmasını sağlar.

Kullanım örneğine genel bakış

Aşağıdaki bölümlerde, çözüme genel bakışta gösterildiği gibi Cohere, AWS ve Weaviate ile yapay zekaya özgü teknoloji yığınını kullanarak bir RAG çözümünün nasıl oluşturulacağını gösteriyoruz.

Örnek kullanım durumu, bir hedef kitleye dayalı olarak tatilde konaklama listeleri için hedefli reklamlar oluşturur. Amaç, hedef kitleye (örneğin, "küçük çocuklu aile") yönelik kullanıcı sorgusunu kullanarak en alakalı tatil konaklama listesini (örneğin, yakınlarda oyun alanlarının bulunduğu bir liste) almak ve ardından bu grup için bir reklam oluşturmaktır. Hedef kitleye göre uyarlanmış listeleme alındı.

Şekil 2: Inside Airbnb'de bulunan tatil konaklama listelerinin ilk birkaç satırı.

Veri kümesi şu adreste mevcuttur: Airbnb'nin İçinde ve bir lisans altında lisanslıdır Creative Commons Atıf 4.0 Uluslararası Lisansı. Ekteki kodu şurada bulabilirsiniz: GitHub deposu.

Önkoşullar

Aşağıdaki eğitimde yer alan AWS hizmetlerinden herhangi birini takip etmek ve kullanmak için bir AWS hizmetine sahip olduğunuzdan emin olun. AWS hesabı.

Yapay zekaya özgü teknoloji yığınının bileşenlerini etkinleştirin

Öncelikle çözüme genel bakış bölümünde tartışılan ilgili bileşenleri AWS hesabınızda etkinleştirmeniz gerekir. Aşağıdaki adımları tamamlayın:

  1. Solda Amazon Bedrock konsolu, seçmek Model erişimi Gezinti bölmesinde.
  2. Klinik Model erişimini yönetin sağ üstte.
  3. Tercih ettiğiniz temel modellerini seçin ve erişim talebinde bulunun.

Şekil 3: Amazon Bedrock konsolunda model erişimini yönetin.

Daha sonra bir Weaviate kümesi kurarsınız.

  1. Abone ol AWS Marketplace'te Kubernetes Kümesini Weaviate Edin.
  2. Yazılımı bir kullanarak başlatın Tercih ettiğiniz Erişilebilirlik Alanına göre CloudFormation şablonu.

CloudFormation şablonu varsayılan değerlerle önceden doldurulmuştur.

  1. İçin Yığın adı, bir yığın adı girin.
  2. İçin Helma kimlik doğrulama türüayarlayarak kimlik doğrulamanın etkinleştirilmesi önerilir. helmauthenticationtype için apikey ve tanımlayan bir Helmauthenticationapikey.
  3. İçin HelmauthenticationapikeyWeaviate API anahtarınızı girin.
  4. İçin helmchartversiyonu, sürüm numaranızı girin. En az v.16.8.0 olmalıdır. Bakın GitHub repo en son sürüm için.
  5. İçin Helmenabledmodüller, emin olmak tex2vec-aws ve generative-aws Weaviate içindeki etkin modüller listesinde mevcuttur.

Şekil 4: CloudFormation şablonu.

Bu şablonun tamamlanması yaklaşık 30 dakika sürer.

Weaviate'e bağlanın

Weaviate'e bağlanmak için aşağıdaki adımları tamamlayın:

  1. içinde Amazon SageMaker konsolu, şu yöne rotayı ayarla Dizüstü bilgisayar örnekleri Gezinti bölmesinde defter > Dizüstü bilgisayar örnekleri soldaki.
  2. Yeni bir not defteri örneği oluşturun.
  3. Weaviate istemci paketini gerekli bağımlılıklarla yükleyin:
$ pip install weaviate-client

  1. Weaviate örneğinize aşağıdaki kodla bağlanın:
import weaviate

client = weaviate.Client(
  url = "http://<YOUR-WEAVIATE-URL>",
 auth_client_secret=weaviate.AuthApiKey(api_key="YOUR-WEAVIATE-API-KEY"),
    additional_headers={
        "X-AWS-Access-Key": "<YOUR-AWS-ACCESS-KEY>",
        "X-AWS-Secret-Key": "<YOUR-AWS-SECRET-ACCESS-KEY>"
    }
)

Aşağıdaki bilgileri sağlayın:

  • Weaviate URL'si – Yük dengeleyici URL'si aracılığıyla Weaviate'e erişin. İçinde Amazon Elastik Bilgi İşlem Bulutu (Amazon EC2) konsolu, seçin Yük dengeleyiciler Gezinti bölmesinde yük dengeleyiciyi bulun. DNS adı sütununu arayın ve ekleyin http:// onun önünde.
  • Weaviate API anahtarı – Bu, daha önce CloudFormation şablonunda ayarladığınız anahtardır (helmauthenticationapikey).
  • AWS erişim anahtarı ve gizli erişim anahtarı – Kullanıcınız için erişim anahtarını ve gizli erişim anahtarını şuradan alabilirsiniz: AWS Kimlik ve Erişim Yönetimi (IAM) konsolu.

Şekil 5: AWS erişim anahtarını ve gizli erişim anahtarını almak için AWS Identity and Access Management (IAM) konsolu.

Cohere modellerini etkinleştirmek için Amazon Bedrock modülünü yapılandırın

Daha sonra bir veri koleksiyonu tanımlarsınız (class) aranan Listings listelerin veri nesnelerini depolamak için; bu, ilişkisel bir veritabanında tablo oluşturmaya benzer. Bu adımda, Amazon Bedrock'ta yerel olarak barındırılan Cohere dil modellerinin Weaviate vektör veritabanı içinden kullanılmasını sağlamak için ilgili modülleri yapılandırırsınız. Vektörleştirici (“text2vec-aws“) ve üretken modül (“generative-aws“) veri toplama tanımında belirtilmiştir. Bu modüllerin her ikisi de üç parametre alır:

  • "hizmet" - Kullanmak "bedrock” Amazon Bedrock için (alternatif olarak “ kullanın)sagemaker" için Amazon SageMaker Hızlı Başlangıç)
  • “Bölge” – Modelinizin konuşlandırıldığı Bölgeyi girin
  • "Model" – Temel modelinin adını sağlayın

Aşağıdaki koda bakın:

collection_definition = {
    "class": "Listings",
    "moduleConfig": {
        "text2vec-aws": {
            "service": "bedrock",
            "region": "us-east-1",
            "model": "cohere.embed-english-v3",
        },
        "generative-aws": {
            "service": "bedrock",
            "region": "us-east-1",
            "model": "cohere.command-text-v14"
        }
    },
    "vectorizer": "text2vec-aws"
}

Verileri Weaviate vektör veritabanına alın

Bu adımda, özelliklerini yapılandırarak veri toplamanın yapısını tanımlarsınız. Özelliğin adı ve veri türünün yanı sıra, yalnızca veri nesnesinin mi saklanacağını yoksa vektör yerleştirmeleriyle birlikte mi saklanacağını da yapılandırabilirsiniz. Bu örnekte, host_name ve property_type vektörleştirilmemiştir:

collection_definition["properties"] = [
        { "name": "host_name", "dataType": ["text"], 
     "moduleConfig": {"text2vec-aws": {"skip": True}}
        },
        { "name": "property_type", "dataType": ["text"], 
     "moduleConfig": {"text2vec-aws": {"skip": True}}
        }
        { "name": "description", "dataType": ["text"] },
        {"name": "neighborhood_overview", "dataType": ["text"] },
]

Weaviate örneğinizde koleksiyon oluşturmak için aşağıdaki kodu çalıştırın:

client.schema.create_class(collection_definition)

Artık Weaviate'e nesneler ekleyebilirsiniz. Maksimum verimlilik için toplu içe aktarma işlemi kullanırsınız. Verileri içe aktarmak için aşağıdaki kodu çalıştırın. İçe aktarma sırasında Weaviate, her nesne için bir vektör yerleştirme oluşturmak amacıyla tanımlanmış vektörleştiriciyi kullanacaktır. Aşağıdaki kod nesneleri yükler, bir toplu işlemi başlatır ve nesneleri hedef koleksiyona birer birer ekler:

from weaviate.util import generate_uuid5
import pandas as pd

# Read CSV file
csv_file = './data/listings.csv'
df = pd.read_csv(csv_file, usecols = ['host_name', 
                                      'property_type',
                                      'description', 
                                      'neighborhood_overview', 
                                        ])

df.fillna('', inplace=True)

# Configure batch
client.batch.configure(batch_size=100) 

# Initialize batch process
with client.batch as batch:
    for _, row in df.iterrows():
        listing_object = {
            "host_name": row["host_name"],
            "property_type" : row["property_type"],
            "description": row["description"],
            "neighborhood_overview" : row["neighborhood_overview"],
        }
        batch.add_data_object(
            class_name = "Listings",
            data_object = listing_object,
            uuid = generate_uuid5(listing_object)
        )

Alma Artırılmış Nesil

Weaviate örneğinizde üretken bir arama sorgusu uygulayarak bir RAG işlem hattı oluşturabilirsiniz. Bunun için öncelikle kullanıcı sorgusunu alabilecek f-string formunda bir bilgi istemi şablonu tanımlarsınız ({target_audience}) doğrudan ve ek bağlam ({{host_name}}, {{property_type}}, {{description}}, ve {{neighborhood_overview}}) çalışma zamanında vektör veritabanından:

   prompt_template = f"""You are a copywriter.
    Write a short advertisement for the following vacation stay.
    Host: {{host_name}}
    Property type: {{property_type}}
    Description: {{description}}
    Neighborhood: {{neighborhood_overview}}
    Target audience: {target_audience}
    """

Daha sonra üretken bir arama sorgusu çalıştırırsınız. Bu, tanımlanmış üretken modeli, kullanıcı sorgusunun yanı sıra alınan verilerden oluşan bir istemle yönlendirir. Aşağıdaki sorgu bir listeleme nesnesini alır (.with_limit(1)) Den Listings kullanıcı sorgusuna en çok benzeyen koleksiyon (.with_near_text({"concepts": target_audience})). Daha sonra kullanıcı sorgusu (target_audience) ve alınan listeleme özellikleri (["description", "neighborhood", "host_name", "property_type"]) bilgi istemi şablonuna beslenir. Aşağıdaki koda bakın:

   result = client.query
                .get("Listings", 
            ["description", "neighborhood", "host_name", "property_type"])
                .with_near_text({"concepts": target_audience})
                .with_limit(1)
                .with_generate(single_prompt=prompt_template)
                .do()

Aşağıdaki örnekte, önceki kod parçasının şunu görebilirsiniz: target_audience = “Family with small children” ev sahibi Marre'den bir liste alır. Bilgi istemi şablonu, Marre'nin listeleme ayrıntıları ve hedef kitleyle zenginleştirilmiştir:

"You are a copywriter.
Write a short advertisement for the following vacation stay.
Host: Marre
Property type: Entire townhouse
Description: Welcome to our lovely home! You've come to the right place ...
Neighborhood: THE NEIGHBORHOOD:<br /><br />We are in the city centre ...
Target audience: Family with small children"

Erişimle zenginleştirilmiş istemi temel alarak Cohere'in Komut modeli aşağıdaki hedefli reklamı oluşturur:

"Looking for a kid-friendly home away from home in one of the trendiest areas of 
Amsterdam? Look no further than this stylish townhouse in the heart of the city! 
Our 120ft² space is perfect for a family of four or a group of adults, with two 
bedrooms featuring elevated beds suitable for kids and one bedroom with a single 
bed. The ground floor features a spacious living room, a kitchen with a large 
dining table, and a half bath while heading upstairs leads you to a master bedroom 
and a full bathroom. Our central location means you're just steps away from the 
best cafes, restaurants, and bars that the city has to offer, and the Vondelpark 
and other attractions are only a short walk away! Supermarkets and paid parking 
are also conveniently located nearby. Experience the best of Amsterdam in a 
laid-back,local way and create unforgettable memories with your family at our 
cozy townhouse."

Alternatif özelleştirmeler

Önerilen çözümdeki farklı bileşenlere yönelik aşağıdaki gibi alternatif özelleştirmeler yapabilirsiniz:

  • Cohere'in dil modelleri şu adreste de mevcuttur: Amazon SageMaker Hızlı BaşlangıçEn son temel modellere erişim sağlayan ve geliştiricilerin LLM'leri Amazon Adaçayı Yapıcı, her türlü kullanım durumunda yüksek performanslı, düşük maliyetli makine öğrenimini mümkün kılmak için geniş bir araç kümesini bir araya getiren, tümüyle yönetilen bir hizmettir. Weaviate, SageMaker ile de entegredir.
  • Bu çözüme güçlü bir katkı, Tutarlı Yeniden Sıralama uç noktası, SageMaker JumpStart aracılığıyla edinilebilir. Yeniden sıralama, sözcüksel veya anlamsal aramadan elde edilen arama sonuçlarının alaka düzeyini artırabilir. Yeniden sıralama, bir arama sistemi tarafından alınan belgeler için anlamsal uygunluk puanlarını hesaplayarak ve belgeleri bu puanlara göre sıralayarak çalışır. Bir uygulamaya Rerank eklemek yalnızca tek satırlık bir kod değişikliği gerektirir.
  • Farklı üretim ortamlarının farklı dağıtım gereksinimlerini karşılamak için Weaviate çeşitli ek yollarla dağıtılabilir. Örneğin, şu adresten doğrudan indirilebilir: Web sitesiüzerinde çalışan Amazon Elastik Kubernetes Hizmeti (Amazon EKS) veya yerel olarak liman işçisi or Kubernetes. Ayrıca şu şekilde de mevcuttur: yönetilen servis 14 günlük ücretsiz deneme süresiyle bir VPC'de veya AWS'de barındırılan genel bulut hizmeti olarak güvenli bir şekilde çalışabilir.
  • Çözümünüzü bir VPC'de kullanarak sunabilirsiniz. Amazon Sanal Özel Bulut (Amazon VPC), kuruluşların AWS hizmetlerini mantıksal olarak yalıtılmış, geleneksel bir ağa benzeyen ancak AWS'nin ölçeklenebilir altyapısının avantajlarına sahip bir sanal ağda başlatmasına olanak tanır. Verilerin sınıflandırılmış hassasiyet düzeyine bağlı olarak kuruluşlar bu VPC'lerde internet erişimini de devre dışı bırakabilir.

Temizlemek

Beklenmedik ödemeleri önlemek için bu gönderi kapsamında dağıttığınız tüm kaynakları silin. CloudFormation yığınını başlattıysanız bunu AWS CloudFormation konsolu aracılığıyla silebilirsiniz. Aşağıdakiler gibi bazı AWS kaynaklarının olabileceğini unutmayın: Amazon Elastik Blok Mağazası (Amazon EBS) hacimleri ve AWS Anahtar Yönetim Hizmeti (AWS KMS) anahtarları, CloudFormation yığını silindiğinde otomatik olarak silinmeyebilir.

Şekil 6: AWS CloudFormation konsolu aracılığıyla tüm kaynakları silin.

Sonuç

Bu gönderide işletmelerin verileri üzerinde tam kontrol sahibi olurken nasıl doğru, şeffaf ve güvenli üretken yapay zeka uygulamaları geliştirebilecekleri tartışıldı. Önerilen çözüm, Amazon Bedrock'taki Cohere temel modellerinin ve AWS Marketplace'teki Weaviate vektör veritabanının bir kombinasyonu olarak yapay zekaya özgü bir teknoloji yığını kullanan bir RAG işlem hattıdır. RAG yaklaşımı, işletmelerin LLM'nin genel bilgisi ile özel veriler arasındaki boşluğu doldururken halüsinasyonları en aza indirmesine olanak tanır. Yapay zekaya özgü bir teknoloji yığını, hızlı geliştirme ve ölçeklenebilir performans sağlar.

Bu gönderide özetlenen adımları kullanarak, kurumsal kullanıma hazır üretken yapay zeka uygulamalarınız için RAG kavram kanıtlarını denemeye başlayabilirsiniz. Ekteki kaynak kodu şurada mevcuttur: ilgili GitHub deposu. Okuduğunuz için teşekkürler. Yorumlar bölümünde yorum veya geri bildirimde bulunmaktan çekinmeyin.


yazarlar hakkında

James Yi Amazon Web Services'te Technology Partners COE Tech ekibinde Kıdemli AI/ML İş Ortağı Çözümleri Mimarıdır. İş değeri elde etmek amacıyla AI/ML uygulamalarını tasarlamak, dağıtmak ve ölçeklendirmek için kurumsal müşteriler ve iş ortaklarıyla birlikte çalışma konusunda tutkulu. İş dışında futbol oynamaktan, seyahat etmekten ve ailesiyle vakit geçirmekten hoşlanıyor.

Leonie Monigatti Weaviate'de Geliştirici Avukatıdır. Odak alanı AI/ML'dir ve geliştiricilerin üretken yapay zeka hakkında bilgi edinmesine yardımcı olur. İş dışında veri bilimi ve makine öğrenimi konularında öğrendiklerini blogunda ve Kaggle'da paylaşıyor.

Meor Amer En son doğal dil işleme (NLP) teknolojisinin sağlayıcısı olan Cohere'de Geliştirici Avukatıdır. Cohere'in Büyük Dil Modelleri (LLM'ler) ile geliştiricilerin son teknoloji uygulamalar oluşturmasına yardımcı oluyor.

Shun Mao Amazon Web Services'in Gelişen Teknolojiler ekibinde Kıdemli AI/ML İş Ortağı Çözüm Mimarıdır. İş değerlerini elde etmek amacıyla AI/ML uygulamalarını tasarlamak, dağıtmak ve ölçeklendirmek için kurumsal müşteriler ve iş ortaklarıyla birlikte çalışma konusunda tutkulu. İş dışında balık tutmayı, seyahat etmeyi ve pinpon oynamayı seviyor.

spot_img

En Son İstihbarat

spot_img