شعار زيفيرنت

الذكاء الاصطناعي على الحافة: مستقبل الذاكرة والتخزين في تسريع الذكاء | إنترنت الأشياء الآن الأخبار والتقارير

التاريخ:

مقال دعائي

يؤدي الاستخدام المتزايد للذكاء الاصطناعي في الصناعة إلى تسريع الأساليب الأكثر تعقيدًا - بما في ذلك التعلم الآلي (ML)، والتعلم العميق، وحتى نماذج اللغات الكبيرة. تقدم هذه التطورات لمحة عن الكميات الهائلة من البيانات المتوقع استخدامها على الحافة. على الرغم من أن التركيز الحالي كان ينصب على كيفية تسريع تشغيل الشبكة العصبية، إلا أن شركة Micron تركز على إنشاء ذاكرة وتخزين تم تحسينهما للذكاء الاصطناعي عند الحافة.

ما هي البيانات التركيبية؟

IDC تتوقع وبحلول عام 2025، سيكون هناك 175 زيتابايت (1 زيتابايت = 1 مليار تيرابايت) من البيانات الجديدة التي تم إنشاؤها في جميع أنحاء العالم. من الصعب فهم هذه الكميات، ومع ذلك فإن التقدم في الذكاء الاصطناعي سيستمر في دفع حدود الأنظمة المتعطشة للبيانات.

في الواقع، تم خنق نماذج الذكاء الاصطناعي المتزايدة باستمرار بسبب كمية البيانات المادية الحقيقية التي يتم الحصول عليها من القياسات المباشرة أو الصور المادية. من السهل التعرف على البرتقالة إذا كان لديك عينة مكونة من 10,000 صورة متاحة بسهولة للبرتقال. ولكن إذا كنت بحاجة إلى مقارنة مشاهد محددة - على سبيل المثال، حشد عشوائي مقابل مسيرة منظمة أو حالات شاذة في ملف تعريف الارتباط المخبوز مقابل ملف تعريف ارتباط مثالي - فقد يكون من الصعب تأكيد النتائج الدقيقة ما لم يكن لديك جميع العينات المتنوعة لإنشاء خط الأساس الخاص بك نموذج.

الصناعة تستخدم بشكل متزايد البيانات الاصطناعية. يتم إنشاء البيانات الاصطناعية بشكل مصطنع بناءً على نماذج المحاكاة التي تقدم، على سبيل المثال، حقائق إحصائية لنفس الصورة. وينطبق هذا النهج بشكل خاص في أنظمة الرؤية الصناعية حيث تكون الخطوط الأساسية للصور المادية فريدة وحيث لا يمكن العثور على "عناصر واجهة مستخدم" كافية على الويب لتقديم تمثيل نموذجي صالح.

المصدر: “انسَ بياناتك الحقيقية – البيانات الاصطناعية هي مستقبل الذكاء الاصطناعي”، Maverick Research، 2021، عبر “ما هي البيانات الاصطناعية”، جيرارد أندروز، NVIDIA، 2021.

وبطبيعة الحال، يكمن التحدي في المكان الذي ستتواجد فيه هذه الأشكال الجديدة من البيانات. ومن المؤكد أن أي مجموعات بيانات جديدة يتم إنشاؤها يجب أن يتم تخزينها إما في السحابة، أو، للحصول على تمثيلات أكثر فريدة، بالقرب من المكان الذي يجب تحليل البيانات فيه - على الحافة.

تعقيد النموذج وجدار الذاكرة

يعد العثور على التوازن الأمثل بين كفاءة الخوارزميات وأداء نموذج الذكاء الاصطناعي مهمة معقدة، لأنه يعتمد على عوامل مثل خصائص البيانات وحجمها، وتوافر الموارد، واستهلاك الطاقة، ومتطلبات عبء العمل والمزيد.

نماذج الذكاء الاصطناعي هي خوارزميات معقدة يمكن تمييزها بعدد معلماتها: كلما زاد عدد المعلمات، زادت دقة النتائج. بدأت الصناعة بنموذج أساسي مشترك، مثل ResNet50 لأنه كان سهل التنفيذ وأصبح الأساس لأداء الشبكة. لكن هذا النموذج كان يركز على مجموعات بيانات محدودة وتطبيقات محدودة. ومع تطور هذه المحولات، نرى أن تطور المحولات قد زادت المعلمات أكثر من الزيادة عرض النطاق الترددي للذاكرة. تمثل هذه النتيجة ضغطًا واضحًا: بغض النظر عن مقدار البيانات التي يمكن للنموذج التعامل معها، فإننا مقيدون بعرض النطاق الترددي للذاكرة والتخزين المتاح للنموذج والمعلمات.

تطور عدد معلمات نماذج (SOTA) الحديثة على مر السنين، إلى جانب سعة ذاكرة تسريع الذكاء الاصطناعي (النقاط الخضراء). المصدر: “الذكاء الاصطناعي وجدار الذاكرة”، أمير غلامي، متوسط، 2021.تطور عدد معلمات نماذج (SOTA) الحديثة على مر السنين، إلى جانب سعة ذاكرة تسريع الذكاء الاصطناعي (النقاط الخضراء). المصدر: “الذكاء الاصطناعي وجدار الذاكرة”، أمير غلامي، متوسط، 2021.
تطور عدد معلمات نماذج (SOTA) الحديثة على مر السنين، إلى جانب سعة ذاكرة تسريع الذكاء الاصطناعي (النقاط الخضراء). المصدر: “الذكاء الاصطناعي وجدار الذاكرة”، أمير غلامي، متوسط، 2021.

لإجراء مقارنة سريعة، يمكننا إلقاء نظرة على أداء نظام الذكاء الاصطناعي المدمج ستتم عمليات في الثانية (قمم). نرى هنا أن أجهزة AI edge التي تقل عن 100 TOPS قد تحتاج إلى حوالي 225 جيجابايت/ثانية، وتلك التي تزيد عن 100 TOPS قد تتطلب 451 جيجابايت/ثانية من عرض النطاق الترددي للذاكرة (الجدول 1).

الجدول 1 - مقارنة متطلبات النطاق الترددي لذاكرة نظام الذكاء الاصطناعي وعرض النطاق الترددي لجهاز تكنولوجيا الذاكرة. (* النطاق الترددي المقدر المطلوب لتشبع DLA لطراز INT8 Resnet 50). ميكرون.الجدول 1 - مقارنة متطلبات النطاق الترددي لذاكرة نظام الذكاء الاصطناعي وعرض النطاق الترددي لجهاز تكنولوجيا الذاكرة. (* النطاق الترددي المقدر المطلوب لتشبع DLA لطراز INT8 Resnet 50). ميكرون.
الجدول 1 - مقارنة متطلبات النطاق الترددي لذاكرة نظام الذكاء الاصطناعي وعرض النطاق الترددي لجهاز تكنولوجيا الذاكرة. (* النطاق الترددي المقدر المطلوب لتشبع DLA لطراز INT8 Resnet 50). ميكرون.

لذا، إحدى الطرق لتحسين هذا النموذج هي النظر في ذاكرة ذات أداء أعلى توفر أيضًا أقل استهلاك للطاقة.

تواكب الذاكرة حلول الذكاء الاصطناعي المتسارعة من خلال التطور بمعايير جديدة. على سبيل المثال، تتمتع حلول LPDDR4/4X (ذاكرة DDR4 DRAM منخفضة الطاقة) وLPDDR5/5X (ذاكرة DDR5 DRAM منخفضة الطاقة) بتحسينات كبيرة في الأداء مقارنة بالتقنيات السابقة.

يمكن لـ LPDDR4 تشغيل ما يصل إلى 4.2 GT/s لكل طرف (نقل جيجا في الثانية لكل طرف) ودعم ما يصل إلى x64 عرض الناقل. يوفر LPDDR5X زيادة في الأداء بنسبة 50% مقارنة بـ LPDDR4، مما يضاعف الأداء إلى ما يصل إلى 8.5GT/s لكل طرف. بالإضافة إلى ذلك، يوفر LPDDR5 كفاءة طاقة أفضل بنسبة 20% من LPDDR4X (المصدر: ميكرون). هذه تطورات مهمة يمكن أن تدعم الحاجة إلى تلبية حالات استخدام حافة الذكاء الاصطناعي المتزايدة.

ما هي اعتبارات التخزين؟

لا يكفي الاعتقاد بأن موارد الحوسبة محدودة بالأجزاء العلوية الأولية لوحدة المعالجة أو بعرض النطاق الترددي لبنية الذاكرة. نظرًا لأن نماذج تعلم الآلة أصبحت أكثر تعقيدًا، فإن عدد معلمات النموذج يتزايد بشكل كبير أيضًا.

تتوسع نماذج التعلم الآلي ومجموعات البيانات لتحقيق كفاءات أفضل للنماذج، لذلك ستكون هناك حاجة أيضًا إلى تخزين مضمن عالي الأداء. تعتبر حلول NAND المُدارة النموذجية مثل e.MMC 5.1 بسرعة 3.2 جيجابت/ثانية مثالية ليس فقط لعرض التعليمات البرمجية ولكن أيضًا لتخزين البيانات عن بُعد. بالإضافة إلى ذلك، يمكن لحلول مثل UFS 3.1 أن تعمل بشكل أسرع سبع مرات - إلى 23.2 جيجابت/ثانية - للسماح بنماذج أكثر تعقيدًا.

تعمل البنى الجديدة أيضًا على دفع الوظائف إلى الحافة والتي كانت عادةً ما يتم نقلها إلى السحابة أو البنية التحتية لتكنولوجيا المعلومات. على سبيل المثال، تنفذ حلول الحافة طبقة آمنة توفر فجوة هوائية بين بيانات التشغيل المقيدة ومجال تكنولوجيا المعلومات/السحابة. يدعم الذكاء الاصطناعي الموجود على الحافة أيضًا الأتمتة الذكية مثل تصنيف البيانات المخزنة ووضع العلامات عليها واسترجاعها.

توفر تطورات تخزين الذاكرة مثل محركات أقراص NVMe SSD التي تدعم 3D TLC NAND أداءً عاليًا لأحمال عمل الحافة المختلفة. على سبيل المثال، يستخدم محرك الأقراص Micron's 7450 NVMe SSD تقنية NAND المكونة من 176 طبقة والتي تعتبر مثالية لمعظم أحمال عمل مراكز البيانات والحافة. بفضل زمن استجابة جودة الخدمة (QoS) الذي يبلغ 2 مللي ثانية، فهو مثالي لمتطلبات الأداء لمنصات خادم SQL. كما يقدم FIPS 140-3 المستوى 2 و الامتثال TAA لمتطلبات المشتريات الحكومية الفيدرالية الأمريكية.

النظام البيئي المتنامي لمعالجات حافة الذكاء الاصطناعي

وتشير تقديرات شركة Allied Market Research إلى أن سوق معالجات الذكاء الاصطناعي الطرفية سوف تنمو إلى 9.6 مليار دولار أمريكي بحلول عام 2030. 4 ومن المثير للاهتمام أن هذه المجموعة الجديدة من الشركات الناشئة في مجال معالجات الذكاء الاصطناعي تعمل على تطوير ASICs وASSPs الخاصة والموجهة لمزيد من تطبيقات الحافة المقيدة بالمساحة والطاقة. تحتاج هذه الشرائح الجديدة أيضًا إلى التوازن بين الأداء والقوة عندما يتعلق الأمر بحلول الذاكرة والتخزين.

بالإضافة إلى ذلك، نرى أن موردي شرائح الذكاء الاصطناعي قد قاموا بتطوير بطاقات تسريع ذات عامل الشكل القياسي (EDSFF) للمؤسسات ومركز البيانات والتي يمكن تثبيتها في حل مكون من وحدة واحدة وتقع مع خوادم تخزين قابلة للتكيف لتسريع أي عبء عمل - بدءًا من استدلال الذكاء الاصطناعي/تعلم الآلة وحتى معالجة الفيديو - باستخدام نفس الوحدة.

كيف تبحث عن شريك الذاكرة والتخزين المناسب؟

لم يعد الذكاء الاصطناعي مجرد ضجيج بل أصبح حقيقة يتم تنفيذها في جميع القطاعات. في إحدى الدراسات، 89% من الصناعة لديها بالفعل استراتيجية أو سيكون لديها استراتيجية حول الذكاء الاصطناعي على الحافة خلال العامين المقبلين.5

لكن تنفيذ الذكاء الاصطناعي ليس مهمة تافهة، والتقنيات والمكونات المناسبة ستحدث فرقا كبيرا. مجموعة ميكرون من أحدث التقنيات، سواء في الذاكرة أو التخزين، تقود الطريق للعملاء الصناعيين من خلال منتجاتنا اقتراح قيمة معدل الذكاء. إذا كنت تصمم نظام AI Edge System، فاسمح لـ Micron بالمساعدة في توصيل منتجك إلى السوق بشكل أسرع من أي وقت مضى. اتصل بممثل Micron المحلي أو موزع منتجات Micron (www.micron.com).

قم بالتعليق على هذه المقالة أدناه أو عبر X: IoTNow_

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة