Bugün, bunu duyurmaktan heyecan duyuyoruz Mistral-NeMo-Üssü-2407 ve Mistral-NeMo-Talimat-2407—on iki milyar parametreli büyük dil modelleri Mistral Yapay Zeka metin oluşturmada mükemmel olan—müşterilere şu şekilde sunulmaktadır: Amazon SageMaker Hızlı Başlangıç. Bu modelleri, çıkarım çalıştırmak için tek tıklamayla dağıtılabilen algoritmalara ve modellere erişim sağlayan bir makine öğrenimi (ML) merkezi olan SageMaker JumpStart ile deneyebilirsiniz. Bu gönderide, çeşitli gerçek dünya kullanım durumları için Mistral-NeMo-Instruct-2407 ve Mistral-NeMo-Base-2407 modellerinin nasıl keşfedileceğini, dağıtılacağını ve kullanılacağını ele alıyoruz.
Mistral-NeMo-Instruct-2407 ve Mistral-NeMo-Base-2407 genel bakış
Mistral NeMoMistral AI ve NVIDIA arasındaki iş birliğiyle geliştirilen ve Apache 12 lisansı altında yayınlanan güçlü bir 2.0B parametre modeli olan , artık SageMaker JumpStart'ta mevcuttur. Bu model, çok dilli AI yetenekleri ve erişilebilirliğinde önemli bir ilerlemeyi temsil eder.
Temel özellikler ve yetenekler
Mistral NeMo, kapsamlı uzun biçimli içeriklerin işlenmesini sağlayan 128k token bağlam penceresine sahiptir. Model, akıl yürütme, dünya bilgisi ve kodlama doğruluğunda güçlü performans gösterir. Hem önceden eğitilmiş temel hem de talimat ayarlı kontrol noktaları Apache 2.0 lisansı altında mevcuttur ve bu da onu araştırmacılar ve işletmeler için erişilebilir hale getirir. Modelin niceleme farkında eğitimi, kaliteyi tehlikeye atmadan optimum FP8 çıkarım performansını kolaylaştırır.
Çok dilli destek
Mistral NeMo, İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Çince, Japonca, Korece, Arapça ve Hintçe dahil olmak üzere birden fazla dilde güçlü performansla küresel uygulamalar için tasarlanmıştır. Bu çok dilli yetenek, yerleşik işlev çağrısı ve kapsamlı bir bağlam penceresiyle birleştiğinde, gelişmiş AI'nın çeşitli dilsel ve kültürel manzaralarda daha erişilebilir olmasına yardımcı olur.
Tekken: Gelişmiş tokenleştirme
Model, tiktoken'a dayalı yenilikçi bir tokenizer olan Tekken'i kullanır. 100'den fazla dilde eğitilen Tekken, doğal dil metni ve kaynak kodu için iyileştirilmiş sıkıştırma verimliliği sunar.
SageMaker JumpStart'a genel bakış
SageMaker JumpStart, içerik yazma, kod oluşturma, soru cevaplama, metin yazarlığı, özetleme, sınıflandırma ve bilgi alma gibi çeşitli kullanım durumları için son teknoloji temel modeller sunan tamamen yönetilen bir hizmettir. Hızlı bir şekilde dağıtabileceğiniz önceden eğitilmiş modellerden oluşan bir koleksiyon sunar ve ML uygulamalarının geliştirilmesini ve dağıtımını hızlandırır. SageMaker JumpStart'ın temel bileşenlerinden biri, çeşitli görevler için DBRX gibi önceden eğitilmiş modellerin geniş bir kataloğunu sunan Model Hub'dır.
Artık birkaç tıklamayla her iki Mistral NeMo modelini de keşfedebilir ve konuşlandırabilirsiniz. Amazon SageMaker Stüdyosu veya SageMaker Python SDK aracılığıyla programatik olarak, model performansını ve makine öğrenimi işlemleri (MLOps) kontrollerini türetmenizi sağlar Amazon Adaçayı Yapıcı gibi özellikler Amazon SageMaker Ardışık Düzenleri, Amazon SageMaker Hata Ayıklayıcısı, veya konteyner günlükleri. Model, AWS güvenli bir ortamda ve sanal özel bulut (VPC) kontrolleriniz altında dağıtılır ve veri güvenliğini desteklemeye yardımcı olur.
Önkoşullar
SageMaker JumpStart'ta her iki NeMo modelini de denemek için aşağıdaki ön koşullara ihtiyacınız olacak:
SageMaker JumpStart'ta Mistral NeMo modellerini keşfedin
NeMo modellerine SageMaker Studio UI ve SageMaker Python SDK'sındaki SageMaker JumpStart aracılığıyla erişebilirsiniz. Bu bölümde, SageMaker Studio'daki modelleri nasıl keşfedeceğinizi ele alacağız.
SageMaker Studio, verileri hazırlamaktan ML modellerinizi oluşturmaya, eğitmeye ve dağıtmaya kadar ML geliştirme adımlarını gerçekleştirmek için özel olarak oluşturulmuş araçlara erişebileceğiniz tek bir web tabanlı görsel arayüz sağlayan entegre bir geliştirme ortamıdır (IDE). SageMaker Studio'yu nasıl başlatacağınız ve kuracağınız hakkında daha fazla bilgi için bkz. Amazon SageMaker Stüdyosu.
SageMaker Studio'da SageMaker JumpStart'a şu seçeneği seçerek erişebilirsiniz: HızlıBaşlangıç Gezinti bölmesinde.
Sonra seç SarılmaYüz.
SageMaker JumpStart açılış sayfasından, arama kutusunda NeMo'yu arayabilirsiniz. Arama sonuçları listelenecektir Mistral NeMo Talimatları ve Mistral NeMo Üssü.
Lisans, eğitim için kullanılan veriler ve modelin nasıl kullanılacağı gibi modelle ilgili ayrıntıları görüntülemek için model kartını seçebilirsiniz. Ayrıca şunları bulacaksınız: Sürüş Modeli dağıtmak ve bir uç nokta oluşturmak için düğmeyi kullanın.
Modeli SageMaker JumpStart'ta dağıtın
Dağıtım, Dağıtım düğmesini seçtiğinizde başlar. Dağıtım tamamlandıktan sonra, bir uç noktanın oluşturulduğunu göreceksiniz. Uç noktayı, örnek bir çıkarım isteği yükü geçirerek veya SDK'yi kullanarak test seçeneğini belirleyerek test edebilirsiniz. SDK'yi kullanma seçeneğini belirlediğinizde, SageMaker Studio'da istediğiniz not defteri düzenleyicisinde kullanabileceğiniz örnek kod göreceksiniz.
Modeli SageMaker Python SDK ile dağıtın
SDK'yı kullanarak dağıtım yapmak için, SDK tarafından belirtilen Mistral NeMo Base modelini seçerek başlıyoruz. model_id
değeri ile huggingface-llm-mistral-nemo-base-2407
. Aşağıdaki kodla seçili modellerden istediğinizi SageMaker'a dağıtabilirsiniz. Benzer şekilde, NeMo Instruct'ı kendi model kimliğini kullanarak dağıtabilirsiniz.
Bu, modeli SageMaker'da, varsayılan örnek türü ve varsayılan VPC yapılandırmaları dahil olmak üzere varsayılan yapılandırmalarla dağıtır. Varsayılan olmayan değerleri belirterek bu yapılandırmaları değiştirebilirsiniz. HızlıBaşlangıçModeli. Son kullanıcı lisans sözleşmesini (EULA) kabul etmek için EULA değeri açıkça True olarak tanımlanmalıdır. Ayrıca, kullanmak için hesap düzeyinde hizmet sınırına sahip olduğunuzdan emin olun. ml.g6.12xlarge
uç nokta kullanımı için bir veya daha fazla örnek olarak. Talimatları takip edebilirsiniz AWS hizmet kotaları bir hizmet kotası artışı talep etmek için. Dağıtıldıktan sonra, dağıtılan uç noktaya karşı SageMaker tahmincisi aracılığıyla çıkarım çalıştırabilirsiniz:
Burada dikkat edilmesi gereken önemli bir nokta, kullandığımız djl-lmi v12 çıkarım konteyneri, bu yüzden takip ediyoruz büyük model çıkarımı sohbet tamamlamaları API şeması Mistral-NeMo-Base-2407 ve Mistral-NeMo-Instruct-2407'ye bir yük gönderirken.
Mistral-NeMo-Üssü-2407
Mistral-NeMo-Base-2407 modeliyle, modelin bir girdi dizisini işlediği ve dizideki tahmin edilen sonraki kelimeleri çıktı olarak verdiği diğer standart metin oluşturma modelleri gibi etkileşim kurabilirsiniz. Bu bölümde, bazı örnek istemler ve örnek çıktılar sağlıyoruz. Temel modelin talimat açısından ince ayarlı olmadığını unutmayın.
Metin tamamlama
Bir sonraki jetonu tahmin etmeyi veya bir dizideki eksik jetonları doldurmayı içeren görevler:
Çıktı aşağıdaki gibidir:
Mistral NeMo Talimatları
Mistral-NeMo-Instruct-2407 modeli, temel modelin etkileyici performans elde etmek için ince ayarlanabileceğinin hızlı bir gösterimidir. Modeli dağıtmak ve kullanmak için sağlanan adımları takip edebilirsiniz model_id
değeri huggingface-llm-mistral-nemo-instruct-2407
yerine.
Talimat ayarlı NeMo modeli aşağıdaki görevlerle test edilebilir:
Kod oluşturma
Mistral NeMo Instruct, kodlama görevleri için kıyaslamalı güçlü yönlerini gösterir. Mistral, NeMo için Tekken tokenizer'ının kaynak kodunu sıkıştırmada yaklaşık %30 daha verimli olduğunu belirtir. Örneğin, aşağıdaki koda bakın:
Çıktı aşağıdaki gibidir:
Model, kod oluşturma görevlerinde güçlü bir performans sergiliyor; completion_tokens
tokenleştiricinin kod sıkıştırmasının, daha az token kullanarak programlama dillerinin gösterimini nasıl etkili bir şekilde optimize ettiğine dair içgörü sunmak.
İleri matematik ve muhakeme
Model ayrıca matematik ve muhakeme doğruluğunda güçlü yönler bildiriyor. Örneğin, aşağıdaki koda bakın:
Çıktı aşağıdaki gibidir:
Bu görevde, Mistral'in yeni Tekken tokenizer'ını test edelim. Mistral, tokenizer'ın Korece ve Arapça'yı sıkıştırmada sırasıyla iki kat ve üç kat daha verimli olduğunu belirtiyor.
Burada çeviri amaçlı bir miktar metin kullanacağız:
Modelin Korece ve Arapçaya çeviri konusunda talimat vermesini sağlamak için komutumuzu ayarladık:
Daha sonra yükü ayarlayabiliriz:
Çıktı aşağıdaki gibidir:
Çeviri sonuçları, çeviri sayısının nasıl değiştiğini göstermektedir. completion_tokens
kullanımı, Korece ve Arapça gibi dilleri içeren çeviriler gibi tipik olarak token yoğun görevler için bile önemli ölçüde azaltılmıştır. Bu iyileştirme, Tekken tokenizer tarafından sağlanan optimizasyonlar sayesinde mümkün olmuştur. Böyle bir azaltma, özetleme, dil oluşturma ve çok turlu konuşmalar gibi token yoğun uygulamalar için özellikle değerlidir. Token verimliliğini artırarak, Tekken tokenizer aynı kaynak kısıtlamaları içinde daha fazla görevin işlenmesine olanak tanır ve bu da onu token kullanımının performansı ve maliyeti doğrudan etkilediği iş akışlarını optimize etmek için paha biçilmez bir araç haline getirir.
Temizlemek
Not defterini çalıştırmayı bitirdikten sonra, ek faturalandırmadan kaçınmak için işlem sırasında oluşturduğunuz tüm kaynakları sildiğinizden emin olun. Aşağıdaki kodu kullanın:
Sonuç
Bu gönderide, SageMaker Studio'da Mistral NeMo Base ve Instruct ile nasıl başlayacağınızı ve çıkarım için modeli nasıl dağıtacağınızı gösterdik. Temel modeller önceden eğitildiği için, eğitim ve altyapı maliyetlerini düşürmeye yardımcı olabilir ve kullanım durumunuz için özelleştirmeyi mümkün kılabilir. Ziyaret edin SageMaker Studio'da SageMaker JumpStart şimdi başlamak için.
AWS hakkında daha fazla Mistral kaynağı için şuraya göz atın: Mistral-on-AWS GitHub deposu.
yazarlar hakkında
Niithiyn Vijeaswaran AWS'deki Üçüncü Taraf Model Bilimi ekibinde Generative AI Uzman Çözüm Mimarıdır. Odaklandığı alan generative AI ve AWS AI Hızlandırıcılarıdır. Bilgisayar Bilimi ve Biyoenformatik alanında Lisans derecesine sahiptir.
Preston Tuggle üretken yapay zeka üzerinde çalışan Kıdemli Uzman Çözüm Mimarıdır.
shane rai AWS World Wide Specialist Organization (WWSO)'da Baş Üretici Yapay Zeka Uzmanıdır. AWS tarafından sağlanan bulut tabanlı AI/ML hizmetlerinin genişliğini kullanarak, en acil ve yenilikçi iş ihtiyaçlarını çözmek için sektörler arası müşterilerle çalışır; buna en üst düzey temel model sağlayıcılarının sunduğu model teklifleri de dahildir.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/mistral-nemo-instruct-2407-and-mistral-nemo-base-2407-are-now-available-on-sagemaker-jumpstart/