شعار زيفيرنت

بناء جهاز GPU مقابل استخدام GPU Cloud – KDnuggets

التاريخ:

بناء جهاز GPU مقابل استخدام GPU Cloud
الصورة بواسطة المحرر
 

لقد كان ظهور وحدات المعالجة الرسومية (GPUs)، وقدرة الحوسبة الهائلة التي أطلقتها، بمثابة لحظة فاصلة للشركات الناشئة والشركات التجارية على حدٍ سواء. 

توفر وحدات معالجة الرسومات قوة حسابية مذهلة لأداء المهام المعقدة التي تنطوي على تكنولوجيا مثل الذكاء الاصطناعي، آلة التعلم، والعرض ثلاثي الأبعاد. 

ومع ذلك، عندما يتعلق الأمر بتسخير هذه الوفرة من القوة الحسابية، فإن عالم التكنولوجيا يقف عند مفترق طرق فيما يتعلق بالحل المثالي. هل يجب عليك إنشاء جهاز GPU مخصص أو الاستفادة من سحابة GPU؟ 

تتعمق هذه المقالة في قلب هذه المناقشة، وتحلل آثار التكلفة، ومقاييس الأداء، وعوامل قابلية التوسع لكل خيار.

وحدات معالجة الرسوميات (GPUs) هي شرائح كمبيوتر مصممة لتقديم الرسومات والصور بسرعة من خلال استكمال الحسابات الرياضية بشكل فوري تقريبًا. تاريخيًا، كانت وحدات معالجة الرسوميات غالبًا ما ترتبط بأجهزة كمبيوتر الألعاب الشخصية، ولكنها تُستخدم أيضًا في الحوسبة الاحترافية، حيث يتطلب التقدم التكنولوجي قوة حاسوبية إضافية. 

تم تطوير وحدات معالجة الرسوميات في البداية لتقليل عبء العمل الذي يتم وضعه على وحدة المعالجة المركزية من خلال التطبيقات الحديثة ذات الرسومات المكثفة، وتقديم الرسومات ثنائية وثلاثية الأبعاد باستخدام المعالجة المتوازية، وهي طريقة تتضمن معالجات متعددة تتعامل مع أجزاء مختلفة من مهمة واحدة. 

في مجال الأعمال، تعد هذه المنهجية فعالة في تسريع أعباء العمل وتوفير قوة معالجة كافية لتمكين مشاريع مثل نمذجة الذكاء الاصطناعي (AI) والتعلم الآلي (ML). 

حالات استخدام وحدة معالجة الرسومات

تطورت وحدات معالجة الرسومات في السنوات الأخيرة، وأصبحت أكثر قابلية للبرمجة من نظيراتها السابقة، مما يسمح باستخدامها في نطاق واسع من حالات الاستخدام، مثل:

  • العرض السريع للتطبيقات الرسومية ثنائية وثلاثية الأبعاد في الوقت الفعلي، باستخدام برامج مثل Blender وZBrush
  • تحرير الفيديو وإنشاء محتوى الفيديو، وخاصة المقاطع التي تكون بدقة 4k أو 8k أو ذات معدل إطارات مرتفع
  • توفير القوة الرسومية لعرض ألعاب الفيديو على شاشات العرض الحديثة، بما في ذلك 4K.
  • تسريع نماذج التعلم الآلي، من الأساسي تحويل الصورة إلى jpg لنشر نماذج معدلة خصيصًا بواجهات أمامية كاملة في غضون دقائق
  • مشاركة أحمال عمل وحدة المعالجة المركزية لتقديم أداء أعلى في مجموعة من التطبيقات
  • توفير الموارد الحسابية لتدريب الشبكات العصبية العميقة
  • تعدين العملات المشفرة مثل البيتكوين والإثيريوم

من خلال التركيز على تطوير الشبكات العصبية، تتكون كل شبكة من العقد التي تقوم كل منها بإجراء العمليات الحسابية كجزء من نموذج تحليلي أوسع. 

يمكن لوحدات معالجة الرسومات تحسين أداء هذه النماذج عبر شبكة التعلم العميق بفضل المعالجة المتوازية الأكبر، مما يؤدي إلى إنشاء نماذج ذات قدرة أعلى على تحمل الأخطاء. ونتيجة لذلك، يوجد الآن العديد من وحدات معالجة الرسوميات في السوق والتي تم تصميمها خصيصًا لمشاريع التعلم العميق، مثل H200 المعلن عنه مؤخرًا

تختار العديد من الشركات، وخاصة الشركات الناشئة، بناء أجهزة GPU الخاصة بها نظرًا لفعاليتها من حيث التكلفة، مع الاستمرار في تقديم نفس الأداء الذي توفره حل سحابة GPU. ومع ذلك، هذا لا يعني أن مثل هذا المشروع لا يأتي مع التحديات. 

في هذا القسم، سنناقش إيجابيات وسلبيات بناء جهاز GPU، بما في ذلك التكاليف المتوقعة وإدارة الجهاز التي قد تؤثر على عوامل مثل الأمان وقابلية التوسع. 

لماذا تقوم ببناء جهاز GPU الخاص بك؟

الميزة الأساسية لبناء جهاز GPU داخل الشركة هي التكلفة، لكن مثل هذا المشروع ليس ممكنًا دائمًا بدون خبرة داخلية كبيرة. تعتبر الصيانة المستمرة والتعديلات المستقبلية أيضًا من الاعتبارات التي قد تجعل مثل هذا الحل غير قابل للتطبيق. ولكن، إذا كان هذا البناء ضمن قدرات فريقك، أو إذا وجدت بائعًا خارجيًا يمكنه تسليم المشروع لك، فقد تكون التوفيرات المالية كبيرة. 

يُنصح ببناء جهاز GPU قابل للتطوير لمشاريع التعلم العميق، خاصة عند النظر في تكاليف استئجار خدمات GPU السحابية مثل أمازون ويب سيرفيسز EC2, سحابة جوجلالطرق أو مايكروسوفت أزور. على الرغم من أن الخدمة المُدارة قد تكون مثالية للمؤسسات التي تتطلع إلى بدء مشروعها في أقرب وقت ممكن. 

دعونا نفكر في الميزتين الرئيسيتين لجهاز GPU محلي الصنع والتكلفة والأداء.

التكاليف

إذا كانت إحدى المؤسسات تعمل على تطوير شبكة عصبية عميقة تحتوي على مجموعات بيانات كبيرة لمشاريع الذكاء الاصطناعي والتعلم الآلي، فقد ترتفع تكاليف التشغيل في بعض الأحيان بشكل كبير. يمكن أن يعيق ذلك المطورين من تحقيق النتائج المقصودة أثناء التدريب النموذجي ويحد من قابلية تطوير المشروع. ونتيجة لذلك، يمكن أن تؤدي الآثار المالية إلى تقليص حجم المنتج، أو حتى نموذج غير مناسب للغرض. 

يمكن أن يساعد إنشاء جهاز GPU موجود في الموقع ويتم إدارته ذاتيًا في تقليل التكاليف بشكل كبير، مما يوفر للمطورين ومهندسي البيانات الموارد التي يحتاجونها للتكرار والاختبار والتجريب على نطاق واسع. 

ومع ذلك، فإن هذا لا يعدو كونه مجرد خدش للسطح عندما يتعلق الأمر بأجهزة GPU المبنية والمدارة محليًا، خاصة بالنسبة لبرامج LLM مفتوحة المصدر، والتي تزداد شعبية. مع ظهور واجهات المستخدم الفعلية، قد ترى قريبًا طبيب أسنان حيك الودود تشغيل زوجين من 4090s في الغرفة الخلفية للأشياء مثل التحقق من التأمينوالجدولة والإحالة المرجعية للبيانات وغير ذلك الكثير.
 
 

الأداء

تتطلب نماذج/خوارزميات التعلم العميق والتعلم الآلي المكثفة الكثير من الموارد، مما يعني أنها تحتاج إلى قدرات معالجة عالية الأداء للغاية. ويمكن قول الشيء نفسه بالنسبة للمؤسسات التي تحتاج إلى تقديم مقاطع فيديو عالية الجودة، والتي يطلبها الموظفون أنظمة متعددة تعتمد على GPU أو خادم GPU متطور. 

يوصى باستخدام الأنظمة ذاتية الصنع التي تعمل بوحدة معالجة الرسومات لنماذج البيانات على مستوى الإنتاج وتدريبها، مع قدرة بعض وحدات معالجة الرسومات على توفير دقة مضاعفة، وهي ميزة يمثل الأرقام باستخدام 64 بت، مما يوفر نطاقًا أكبر من القيم ودقة عشرية أفضل. ومع ذلك، هذه الوظيفة مطلوبة فقط للنماذج التي تعتمد على الدقة العالية جدًا. أحد الخيارات الموصى بها لنظام الدقة المزدوجة هو خادم GPU الداخلي المستند إلى Titan من Nvidia.

عمليات

تفتقر العديد من المؤسسات إلى الخبرة والإمكانيات اللازمة لإدارة أجهزة وخوادم وحدة معالجة الرسومات داخل الشركة. وذلك لأن فريق تكنولوجيا المعلومات الداخلي سيحتاج إلى خبراء قادرين على تكوين البنية التحتية المستندة إلى وحدة معالجة الرسومات لتحقيق أعلى مستوى من الأداء. 

علاوة على ذلك، قد يؤدي افتقاره إلى الخبرة إلى نقص الأمن، مما يؤدي إلى ظهور نقاط ضعف يمكن أن يستهدفها مجرمو الإنترنت. وقد تشكل الحاجة إلى توسيع نطاق النظام في المستقبل تحديًا أيضًا. 

توفر أجهزة GPU المحلية مزايا واضحة من حيث الأداء وفعالية التكلفة، ولكن فقط إذا كان لدى المؤسسات الخبراء الداخليين المطلوبين. ولهذا السبب تختار العديد من المؤسسات استخدام الخدمات السحابية لوحدة معالجة الرسومات، مثل Saturn Cloud التي تتم إدارتها بالكامل لمزيد من البساطة وراحة البال. 

تعمل حلول Cloud GPU على تسهيل الوصول إلى مشاريع التعلم العميق لمجموعة واسعة من المؤسسات والصناعات، مع العديد من الأنظمة القادرة على مطابقة مستويات أداء أجهزة GPU ذاتية الصنع. يعد ظهور الحلول السحابية لوحدة معالجة الرسومات (GPU) أحد الأسباب الرئيسية التي تدفع الناس إلى ذلك الاستثمار في تطوير الذكاء الاصطناعي المزيد والمزيد، وخاصة نماذج مفتوحة المصدر مثل ميسترال، والتي تم تصميم طبيعتها مفتوحة المصدر خصيصًا لـ "vRAM القابلة للتأجير" وتشغيل LLMs دون الاعتماد على مقدمي خدمات أكبر، مثل OpenAI أو Anthropic. 

التكاليف

اعتمادًا على احتياجات المنظمة أو النموذج الذي يتم تدريبه، أ حل GPU السحابي يمكن أن تعمل بتكلفة أقل، بشرط أن تكون الساعات المطلوبة كل أسبوع معقولة. بالنسبة للمشاريع الأصغر حجمًا والأقل كثافة في البيانات، ربما لا تكون هناك حاجة للاستثمار في زوج مكلف من H100s، مع توفر حلول GPU السحابية على أساس تعاقدي، وكذلك في شكل خطط شهرية مختلفة، تلبي احتياجات المتحمسين جميعهم الطريق إلى المؤسسة. 

الأداء

هناك مجموعة من خيارات وحدة المعالجة المركزية السحابية التي يمكنها مطابقة مستويات أداء جهاز GPU DIY، مما يوفر معالجات متوازنة على النحو الأمثل، وذاكرة دقيقة، وقرص عالي الأداء، وثماني وحدات معالجة رسومات لكل مثيل للتعامل مع أعباء العمل الفردية. بالطبع، قد تأتي هذه الحلول بتكلفة ولكن يمكن للمؤسسات ترتيب الفواتير بالساعة للتأكد من أنها تدفع فقط مقابل ما تستخدمه. 

عمليات

تتمثل الميزة الرئيسية لوحدة معالجة الرسومات السحابية على بنية وحدة معالجة الرسومات في عملياتها، مع توفر فريق من المهندسين الخبراء للمساعدة في حل أي مشكلات وتقديم الدعم الفني. يجب إدارة جهاز أو خادم وحدة معالجة الرسومات داخل الشركة أو ستحتاج شركة خارجية إلى إدارتها عن بُعد، مقابل تكلفة إضافية. 

باستخدام خدمة GPU السحابية، يمكن إصلاح أي مشكلات مثل تعطل الشبكة أو تحديثات البرامج أو انقطاع التيار الكهربائي أو فشل المعدات أو عدم كفاية مساحة القرص بسرعة. في الواقع، مع وجود حل مُدار بالكامل، من غير المرجح أن تحدث هذه المشكلات على الإطلاق حيث سيتم تكوين خادم GPU على النحو الأمثل لتجنب أي حمل زائد وفشل النظام. وهذا يعني أن فرق تكنولوجيا المعلومات يمكنها التركيز على الاحتياجات الأساسية للشركة.

يعتمد الاختيار بين إنشاء جهاز GPU أو استخدام سحابة GPU على حالة الاستخدام، حيث تتطلب المشروعات الكبيرة كثيفة البيانات أداءً إضافيًا دون تكبد تكاليف كبيرة. في هذا السيناريو، قد يوفر النظام المبني ذاتيًا مقدار الأداء المطلوب دون تكاليف شهرية مرتفعة.

وبدلاً من ذلك، بالنسبة للمؤسسات التي تفتقر إلى الخبرة الداخلية أو التي قد لا تحتاج إلى أداء متطور، قد يكون حل GPU السحابي المُدار هو الأفضل، مع رعاية الجهاز وصيانته من قبل الموفر.
 
 

نهلة ديفيز هو مطور برامج وكاتب تقني. قبل تكريس عملها بدوام كامل للكتابة التقنية ، تمكنت - من بين أشياء أخرى مثيرة للاهتمام - من العمل كمبرمج رئيسي في مؤسسة تجارية تجريبية للعلامة التجارية 5,000 شركة تضم عملائها Samsung و Time Warner و Netflix و Sony.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة