شعار زيفيرنت

نقدم لكم ثلاث مثيلات Amazon EC2 جديدة قائمة على NVIDIA GPU | خدمات الويب الأمازون

التاريخ:

الأمازون الحوسبة المرنة السحابية توفر مجموعة الحوسبة المسرَّعة (Amazon EC2) أوسع خيار من المسرعات لتشغيل أعباء عمل الذكاء الاصطناعي (AI) والتعلم الآلي (ML) والرسومات والحوسبة عالية الأداء (HPC). يسعدنا أن نعلن عن توسيع هذه المجموعة بثلاث مثيلات جديدة تتميز بأحدث وحدات معالجة الرسومات NVIDIA: مثيلات Amazon EC2 P5e المدعومة بوحدات معالجة الرسومات NVIDIA H200، ومثيلات Amazon EC2 G6 التي تتميز بوحدات معالجة الرسومات NVIDIA L4، ومثيلات Amazon EC2 G6e المدعومة بوحدات معالجة الرسومات NVIDIA L40S. ستكون جميع المثيلات الثلاثة متاحة في عام 2024، ونحن نتطلع إلى رؤية ما يمكنك فعله بها.

لقد تعاونت AWS وNVIDIA لأكثر من 13 عامًا وكانا رائدين في الحلول المستندة إلى وحدة معالجة الرسومات واسعة النطاق وعالية الأداء والفعالة من حيث التكلفة للمطورين والمؤسسات عبر الطيف. لقد قمنا بدمج وحدات معالجة الرسومات القوية من NVIDIA مع تقنيات AWS المتميزة مثل نظام AWS Nitro، 3,200 جيجابت في الثانية محول النسيج المرن (EFA) v2، سرعة نقل البيانات تصل إلى مئات الجيجابايت/الثانية أمازون FSx لستروحوسبة exascale مع Amazon EC2 UltraClusters لتقديم البنية التحتية الأكثر أداءً للذكاء الاصطناعي/التعلم الآلي والرسومات والحوسبة عالية الأداء. إلى جانب الخدمات المدارة الأخرى مثل أمازون بيدروك, الأمازون SageMakerو خدمة أمازون مطاطا Kubernetes (Amazon EKS)، توفر هذه المثيلات للمطورين أفضل منصة في الصناعة لبناء ونشر تطبيقات الذكاء الاصطناعي والحوسبة عالية الأداء والرسومات.

مثيلات تعتمد على وحدة معالجة الرسومات عالية الأداء وفعالة من حيث التكلفة لأحمال عمل الذكاء الاصطناعي والحوسبة عالية الأداء والرسومات

لدعم التطوير والتدريب والاستدلال لأكبر نماذج اللغات الكبيرة (LLMs)، ستحتوي مثيلات EC2 P5e على أحدث وحدات معالجة الرسومات H200 من NVIDIA، والتي توفر 141 جيجابايت من ذاكرة وحدة معالجة الرسومات HBM3e، وهي أكبر 1.7 مرة وأسرع 1.4 مرة من وحدات معالجة الرسومات H100. . ستمكنك هذه الزيادة في ذاكرة وحدة معالجة الرسومات إلى جانب ما يصل إلى 3200 جيجابت في الثانية من شبكة EFA التي تم تمكينها بواسطة AWS Nitro System من الاستمرار في إنشاء نماذجك المتطورة وتدريبها ونشرها على AWS.

تم تصميم مثيلات EC2 G6e، التي تتميز بوحدات معالجة الرسومات NVIDIA L40S، لتزويد المطورين بخيار متاح على نطاق واسع للتدريب والاستدلال على LLMs المتاحة للعامة، بالإضافة إلى دعم الاعتماد المتزايد لنماذج اللغات الصغيرة (SLM). كما أنها مثالية لتطبيقات التوأم الرقمي التي تستخدم NVIDIA Omniverse للوصف والمحاكاة عبر الأدوات والتطبيقات ثلاثية الأبعاد، ولإنشاء عوالم افتراضية وسير عمل متقدم للرقمنة الصناعية.

ستوفر مثيلات EC2 G6، التي تتميز بوحدات معالجة الرسومات NVIDIA L4، حلاً منخفض التكلفة وموفرًا للطاقة لنشر نماذج ML لمعالجة اللغة الطبيعية وترجمة اللغة وتحليل الفيديو والصور والتعرف على الكلام والتخصيص بالإضافة إلى أعباء عمل الرسومات، مثل إنشاء وعرض رسومات وبث ألعاب بجودة سينمائية في الوقت الفعلي.


عن المؤلف

شيتان كابور هو مدير إدارة المنتجات لمحفظة الحوسبة السريعة Amazon EC2.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة