شعار زيفيرنت

تقترح شركة Expedera الانتشار المستقر كمعيار للأجهزة الطرفية للذكاء الاصطناعي - Semiwiki

التاريخ:

A الأخيرة مقالة تيك سبوت تشير إلى أن شركة Apple تتحرك بحذر نحو إطلاق نوع ما من الذكاء الاصطناعي التوليدي، ربما مع iOS 18 وA17 Pro. وهذا أمر مثير للاهتمام ليس فقط لمستخدمي Apple مثلي ولكن أيضًا للتحقق على نطاق أوسع من فرصة الهاتف المحمول الحقيقية للذكاء الاصطناعي التوليدي. وهو الأمر الذي لم يكن يبدو أمرًا مسلمًا به بصراحة، لأسباب متعددة. إن العثور على توازن بين الأداء والطلب على الذاكرة يبدو أمرًا شاقًا بالنسبة للنماذج التي تعتمد على مليار معلمة أو أكثر. هل سيكون استنزاف الطاقة مشكلة؟ ثم هناك قضايا قانونية وقضايا هلوسة، والتي ربما يمكن إدارتها من خلال نماذج الاستخدام المحدودة بعناية. على الرغم من التحديات الواضحة، أجد أنه من المشجع أن الشركة التي تميل إلى أن تكون أكثر تفكيرًا في إصدار المنتجات من معظم الشركات الأخرى، ترى طريقًا محتملاً للنجاح. إذا استطاعوا ذلك، فيمكن للآخرين أيضًا ذلك، مما يجعل بلوق الأخيرة من Expedera المنير بالنسبة لي.

تقترح شركة Expedera الانتشار المستقر كمعيار للأجهزة المتطورة الخاصة بالذكاء الاصطناعي

تلخيص سريع حول إنشاء الصور التوليدية

التصوير التوليدي (AI) هو مجال بدأ استكشاف فرصه للتو. لقد اعتدنا بالفعل على تغيير خلفياتنا لمكالمات Zoom/Google Meet، لكن الذكاء الاصطناعي التوليدي يأخذ هذا الأمر إلى أبعد من ذلك بكثير. والآن أصبح بوسعنا أن نعيد تصوير أنفسنا بأزياء مختلفة ذات سمات مختلفة في أماكن خيالية ــ وهو سوق ضخم للمستهلكين المهتمين بالصور. ومن الناحية العملية، يجب أن نكون قادرين على تجربة الملابس فعليًا قبل أن نشتري أو نستكشف الخيارات عند إعادة تصميم المطبخ أو الحمام. هذه التقنية متاحة بالفعل في السحابة (على سبيل المثال Bing Image Creator) ولكن مع كل الجوانب السلبية للخدمات المستندة إلى السحابة، خاصة فيما يتعلق بالخصوصية والتكلفة. يرغب معظم المستهلكين في التفاعل مع هذه الخدمات من خلال الأجهزة المحمولة؛ الحل الأفضل هو الذكاء الاصطناعي المحلي المضمن في تلك المنصات. يعد الذكاء الاصطناعي التوليدي من خلال نموذج Stable Diffusion مفتوح المصدر بمثابة وكيل جيد لمنصات الأجهزة لتلبية هذه الحاجة وبشكل أعم لنماذج LLM القائمة على تقنيات أساسية مماثلة.

هل يمكن موازنة الذاكرة والأداء على متن الطائرة عند الحافة؟

أولاً، نحتاج إلى فهم خط أنابيب الانتشار المستقر. يبدأ هذا باستخدام برنامج تشفير النص لمعالجة المطالبة ("أريد أن أرى سفينة قراصنة تطفو رأسًا على عقب فوق بحر من الجيلي الأخضر"). وتتبع هذه الخطوة شبكة عصبية لإزالة الضوضاء والتي تتعامل مع جزء الانتشار من الخوارزمية، من خلال تكرارات متعددة لإنشاء معلومات للصورة النهائية من المعلمات المدربة. أعتقد أن هذا هو نوع من عكس التعرف على الصور التقليدي، والمطابقة بين المتطلبات الفورية والتدريب لإنشاء تطابق مركب مع الموجه. وأخيرًا، تعرض مرحلة فك التشفير الصورة من البيانات التي تم إنشاؤها في الخطوة السابقة. كل مرحلة من هذه المراحل هي نموذج المحولات.

يقدم مؤلف مدونة Expedera، بات دونيلي (مهندس الحلول)، تحليلًا تفصيليًا للمعلمات والعمليات ونقل البيانات المطلوبة عبر الخوارزمية والتي لن أحاول تكرارها هنا. ما لفت انتباهي هو العدد الهائل من تحركات البيانات. ومع ذلك فهو يفترض وجود ذاكرة عاملة بسعة 8 ميجابايت فقط بناءً على المتطلبات التي يراها مع العملاء بدلاً من الإنتاجية المثلى. عندما سألته عن هذا، قال إن العملية ستعتمد بشكل واضح على واجهة DDR لإدارة الجزء الأكبر من هذا النشاط.

هذا تحول من مدرسة فكرية سمعتها - أن تنفيذ النموذج يجب أن يبقي كل شيء في الذاكرة المحلية لتلبية متطلبات الأداء. لكن هذا يتطلب وجود ذاكرة وصول عشوائي (SRAM) كبيرة بشكل غير معقول على متن الطائرة. تعد ذاكرة الوصول العشوائي الديناميكية (DRAM) منطقية للتعامل مع السعة، لكن مدرسة فكرية أخرى تشير إلى أنه لا أحد يرغب في وضع هذا القدر الكبير من ذاكرة الوصول العشوائي الديناميكية (DRAM) في جهاز محمول. سيكون ذلك مكلفا للغاية. بطيء أيضًا ومتعطش للطاقة.

يعتبر DRAM أو أي نوع آخر من الذاكرة خارج الرقاقة أكثر منطقية ولكن ماذا عن مشكلة التكلفة؟ انظر المرجع أعلاه على أبل. من الواضح أنهم قد يفكرون في استخدام ذاكرة الفلاش، لذا ربما لا يكون هذا النهج جامحًا جدًا. ماذا عن الأداء؟ أخبرني بات أنه بالنسبة لـ Stable Diffusion 1.5، بافتراض محرك 8K MAC مع ذاكرة داخلية سعة 7 ميجا بايت ويعمل بسرعة 750 ميجا هرتز مع عرض نطاق ترددي للذاكرة الخارجية يبلغ 12 جيجا بايت في الثانية، يمكنهم معالجة 9.24 صورة / ثانية من خلال مزيل الضوضاء و 3.29 صورة / ثانية من خلال شبكة فك التشفير. هذا أداء محترم للغاية وجاهز للمستهلك. من الصعب دائمًا تحديد الطاقة لأنها تعتمد على العديد من العوامل، لكن الأرقام التي رأيتها تشير إلى أن هذا يجب أن يكون جيدًا أيضًا لنماذج الاستخدام المتوقعة للمستهلك.

فكرة مفيدة جدا. يبدو أننا يجب أن نضع حدًا للنظرية القائلة بأن الذكاء الاصطناعي للمحولات الكبيرة للحافة لا يمكن أن يعتمد على الذاكرة خارج الرقاقة. مرة أخرى يمكنك قراءة مدونة Expedera هنا.

شارك هذا المنشور عبر:

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة