شعار زيفيرنت

لماذا قد تقوم شركة OpenAI بتحوط رهاناتها على الذكاء الاصطناعي الكمي

التاريخ:

تحليل الأداء ظلت الحوسبة الكمومية على بعد عقد من الزمان منذ أكثر من عقد من الزمان، ولكن وفقًا لخبراء الصناعة، فإنها قد تحمل سر كبح شهية الذكاء الاصطناعي التي لا تشبع.

ومع مرور كل شهر، تظهر نماذج أكبر حجمًا وأكثر كثافة من حيث المعلمات ويتوسع نطاق نشر الذكاء الاصطناعي جنبًا إلى جنب. هذا العام وحده، يخطط المتخصصون في مجال التوسع الفائق مثل Meta للقيام بذلك نشر مئات الآلاف من المسرعات. حتى مؤسس OpenAI سام ألتمان لا يزال كذلك مقتنع سنحتاج إلى المزيد من الحوسبة بشكل كبير إذا أردنا مواصلة تطوير الذكاء الاصطناعي.

ومن ثم لا ينبغي أن يكون مفاجئًا أن يتم تعيينها مؤخرًا، OpenAI سوف التحوط في رهاناتها على الحوسبة الكمومية إذا أمكن ذلك. في الأسبوع الماضي، أضافت قوة الذكاء الاصطناعي بن بارتليت، مهندس أنظمة الكم السابق في PsiQuantum إلى صفوفها.

لقد تواصلنا مع Open AI لمعرفة المزيد حول ما سيفعله Bartlett في شركة رائدة في مجال الذكاء الاصطناعي، ولم نتلق أي رد. ومع ذلك له الحيوي يقدم بعض التلميحات حيث أن الكثير من أبحاثه ركزت على التقاطع بين فيزياء الكم، والتعلم الآلي، والفوتونات النانوية، و"تتكون بشكل أساسي من تصميم مسارات سباق صغيرة للفوتونات التي تخدعهم للقيام بحسابات مفيدة".

إذًا ما الذي يمكن أن تريده شركة OpenAI بالضبط من عالم فيزياء الكم؟ حسنًا، هناك احتمالان يتراوحان بين استخدام التحسين الكمي لتبسيط مجموعات بيانات التدريب أو استخدام وحدات المعالجة الكمومية (QPUs) لتفريغ قواعد بيانات الرسوم البيانية المعقدة، إلى استخدام البصريات للتوسع خارج حدود عبوات أشباه الموصلات الحديثة.

الشبكات العصبية هي مجرد مشكلة تحسين أخرى

تتمتع الحوسبة الكمومية بالقدرة على تحسين كفاءة تدريب نماذج الذكاء الاصطناعي الكبيرة بشكل كبير، مما يسمح لها باستخلاص إجابات أكثر دقة من النماذج ذات المعلمات الأقل، كما يقول موراي توم من شركة D-Wave السجل.

ومع وجود شائعات عن أن GPT-4 يتجاوز تريليون معلمة، فليس من الصعب أن نرى لماذا قد يكون هذا جذابًا. دون اللجوء إلى التكميم واستراتيجيات الضغط الأخرى، تحتاج نماذج الذكاء الاصطناعي إلى حوالي 1 جيجابايت من الذاكرة لكل مليار معلمة عند التشغيل بدقة FP8 أو Int8 وبدقة أعلى، أكثر بكثير من ذلك.

تقترب نماذج المعلمات البالغة تريليون دولار من الحدود التي يمكن أن يستوعبها خادم ذكاء اصطناعي واحد بكفاءة. يمكن ربط عدة خوادم معًا لدعم النماذج الأكبر حجمًا، لكن ترك الصندوق يؤدي إلى انخفاض الأداء.

وهذا اليوم. وإذا كان ألتمان على حق، فإن هذه النماذج سوف تصبح أكبر وأكثر انتشارًا. على هذا النحو، فإن أي تقنية يمكن أن تسمح لـ OpenAI بزيادة قدرة نماذجها دون زيادة عدد المعلمات بشكل مفيد يمكن أن تمنحها ميزة.

يقول تريفور لانتينج، نائب رئيس البرامج والخوارزميات في شركة D-Wave: "أثناء قيامك بتدريب نموذج، فإن عدد المعلمات التي تدخل في النموذج يؤدي بالفعل إلى زيادة تكلفة وتعقيد تدريب النموذج". السجل.

وللتغلب على ذلك، يوضح أن المطورين غالبًا ما يقومون باختيار فرعي للميزات التي يعتقدون أنها ستكون الأكثر أهمية لتدريب هذا النموذج المعين، مما يؤدي بدوره إلى تقليل عدد المعلمات المطلوبة.

ولكن بدلاً من محاولة القيام بذلك باستخدام الأنظمة التقليدية، تطرح D-Wave حجة مفادها أن خوارزميات التحسين الكمي قد تكون أكثر فعالية في تحديد الميزات التي يجب تركها أو إزالتها.

إذا لم تكن مألوفًا، فقد أثبتت مشكلات التحسين، مثل تلك التي تظهر بشكل شائع في إيجاد المسار أو الخدمات اللوجستية، أنها واحدة من أكثر التطبيقات الواعدة للحوسبة الكمومية حتى الآن.

قال توم: "إن ما تجيده أجهزة الكمبيوتر الكمومية حقًا هو تحسين الأشياء التي تحدث أو لا تحدث: مثل تعيين جدول زمني معين لشخص ما أو تعيين تسليم معين". "إذا كانت تلك القرارات مستقلة، فسيكون ذلك جيدًا، وسيكون من السهل على الكمبيوتر الكلاسيكي القيام بذلك، ولكنها تؤثر في الواقع على الموارد الأخرى في المجموعة وهناك نوع من تأثير الشبكة."

وبعبارة أخرى، فإن العالم الحقيقي فوضوي. قد يكون هناك العديد من المركبات على الطريق، وإغلاق الطرق، وأحداث الطقس، وما إلى ذلك. بالمقارنة مع أجهزة الكمبيوتر الكلاسيكية، فإن السمات الفريدة المتأصلة في أجهزة الكمبيوتر الكمومية تسمح لها باستكشاف هذه العوامل في وقت واحد لتحديد أفضل طريق.

يشرح توم أن هذا "يشبه تمامًا الشبكة العصبية حيث تقوم الخلايا العصبية إما بإطلاق النار أو عدم إطلاقها، ولديها اتصالات متشابكة مع الخلايا العصبية الأخرى، والتي إما تثير أو تمنع الخلايا العصبية الأخرى من إطلاق النار".

وهذا يعني أنه يمكن استخدام الخوارزميات الكمومية لتحسين مجموعات بيانات تدريب الذكاء الاصطناعي لتلبية متطلبات محددة، والتي عند تدريبها، تؤدي إلى نموذج أصغر حجمًا وأكثر دقة، كما ادعى لانتينج.

أخذ العينات الكمومية والتفريغ

على المدى الطويل، تبحث D-Wave وآخرون عن طرق لتنفيذ وحدات QPU بشكل أعمق في عملية التدريب.

تتضمن إحدى حالات الاستخدام هذه تطبيق الحوسبة الكمومية على أخذ العينات. يشير أخذ العينات إلى كيفية تحديد نماذج الذكاء الاصطناعي، مثل LLMs، للكلمة التالية، أو بشكل أكثر تحديدًا الرمز المميز، الذي يجب أن يعتمد على توزيع الاحتمالات. هذا هو السبب وراء المزاح في كثير من الأحيان أن LLMs هي مجرد إكمال تلقائي على المنشطات.

"الأجهزة جيدة جدًا في إنتاج العينات، ويمكنك ضبط التوزيع، حتى تتمكن من ضبط وزن تلك العينات. وأوضح لانتينج أن ما نستكشفه هو: هل هذه طريقة جيدة لإدراج الحوسبة الكمومية الصلبة بشكل مباشر وأكثر مباشرة في عبء العمل التدريبي.

تعمل شركة Pasqal الفرنسية الناشئة للحوسبة الكمومية أيضًا على تطبيق الحوسبة الكمومية لتفريغ مجموعات البيانات المنظمة للرسوم البيانية الموجودة عادة في الشبكات العصبية.

"في التعلم الآلي، لا توجد طريقة بسيطة لتمثيل البيانات بشكل كلاسيكي، لأن الرسم البياني كائن معقد،" أوضح لويك هنرييت، الرئيس التنفيذي المشارك لباسكال، في مقابلة مع السجل. "يمكنك دمج البيانات المنظمة للرسم البياني في ديناميكيات الكم بشكل طبيعي نسبيًا، مما يؤدي إلى ظهور بعض الطرق الجديدة لمعالجة تلك الأجزاء من البيانات."

ومع ذلك، قبل أن يتم تحقيق ذلك، يجب أن تصبح الأنظمة الكمومية أكبر بكثير وأسرع بكثير، كما أوضح هنرييت.

وقال: "مجموعات البيانات الكبيرة ليست عملية في الوقت الحالي". "لهذا السبب نحن نزيد عدد الكيوبتات؛ معدل التكرار. لأنه مع المزيد من الكيوبتات، يمكنك تضمين المزيد من البيانات.

من الصعب تحديد المدة التي سيتعين علينا انتظارها قبل أن تصبح الشبكات العصبية للرسم البياني الكمي قابلة للحياة. لدى Pasqal بالفعل نظام 10,000 كيوبت في أعمال. لسوء الحظ، تشير الأبحاث إلى أن الأمر سيستغرق أكثر من 10,000 كيوبت لتصحيح الأخطاء، أو حوالي مليون كيوبت فيزيائية فقط لتصحيح الأخطاء. تنافس مع وحدات معالجة الرسومات الحديثة.

تلعب الضوئيات السيليكون؟

وبغض النظر عن حالات استخدام الذكاء الاصطناعي الكمي الغريبة، هناك تقنيات أخرى يمكن أن تسعى OpenAI إلى اتباعها والتي يصادف أن بارتليت خبير فيها.

ومن الجدير بالذكر أن صاحب العمل السابق لشركة بارتليت PsiQuantum كان يعمل على تطوير أنظمة تعتمد على ضوئيات السيليكون. يشير هذا إلى أن تعيينه قد يكون مرتبطًا بـ OpenAI وذكرت العمل على مسرع الذكاء الاصطناعي المخصص.

قامت العديد من الشركات الناشئة في مجال الضوئيات السيليكون، بما في ذلك Ayar Labs وLightmatter وCelestial AI، بالدفع بالتكنولوجيا كوسيلة للتغلب على حدود النطاق الترددي، والتي أصبحت عاملاً مقيدًا في توسيع نطاق أداء التعلم الآلي.

الفكرة هنا هي أنه يمكنك دفع الكثير من البيانات عبر مسافة أطول بكثير باستخدام الضوء مقارنة بما تستطيعه باستخدام إشارة كهربائية بحتة. في العديد من هذه التصميمات، يتم نقل الضوء فعليًا بواسطة أدلة موجية محفورة في السيليكون، وهو ما يبدو كثيرًا مثل "تصميم مسارات سباق صغيرة للفوتونات".

المادة الخفيفة يعتقد ستسمح هذه التقنية لمسرعات متعددة بالعمل كواحد دون تكبد عقوبة عرض النطاق الترددي للبيانات الخارجة من الشريحة. وفي الوقت نفسه يرى السماوية غير محدودة لزيادة حجم الذاكرة ذات النطاق الترددي العالي المتاحة لوحدات معالجة الرسومات بشكل كبير من خلال القضاء على الحاجة إلى تجميع الوحدات النمطية المجاورة مباشرة لقالب التسريع. ستكون كلتا هاتين الإمكانيتين جذابتين لشركة تعمل مع أنظمة الذكاء الاصطناعي على نطاق واسع.

يبقى أن نرى ما إذا كانت OpenAI ستسعى في نهاية المطاف إلى تحقيق الذكاء الاصطناعي الكمي أو ضوئيات السيليكون، ولكن بالنسبة لشركة ليس مؤسسها غريبًا على القيام باستثمارات طويلة المدى، فلن يكون ذلك أغرب شيء يدعمه ألتمان. ®

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة