شعار زيفيرنت

خلاصة الوعود والمزالق – الجزء الأول » مدونة CCC

التاريخ:

دعمت CCC ثلاث جلسات علمية في مؤتمر AAAS السنوي لهذا العام، وفي حالة عدم تمكنك من الحضور شخصيًا، فسوف نقوم بتلخيص كل جلسة. وفي هذا الأسبوع سنلخص أبرز ما جاء في الدورة “الذكاء الاصطناعي التوليدي في العلوم: الوعود والمزالق". في الجزء الأول سنلخص المقدمة والعرض الذي قدمته الدكتورة ريبيكا ويليت.

عُقدت أول لجنة AAAS التابعة لـ CCC للاجتماع السنوي لعام 2024 يوم الجمعة، 16 فبراير، اليوم الثاني من المؤتمر. اللجنة، يديرها فريق CCC الخاص دكتور ماثيو ترك، رئيس معهد تويوتا التكنولوجي في شيكاغو، وكان يتألف من خبراء يطبقون الذكاء الاصطناعي على مجموعة متنوعة من المجالات العلمية. الدكتورة ريبيكا ويليتركزت، أستاذة الإحصاء وعلوم الكمبيوتر بجامعة شيكاغو، في عرضها التقديمي على كيفية استخدام النماذج التوليدية في العلوم ولماذا لا تكفي النماذج الجاهزة لتطبيقها على البحث العلمي. الدكتور ماركوس بوهلرتحدث، أستاذ الهندسة في معهد ماساتشوستس للتكنولوجيا، عن النماذج التوليدية المطبقة على علوم المواد، و الدكتور دنكان واتسون باريس, أستاذ مساعد في معهد سكريبس لعلوم المحيطات ومعهد هاليجي أوغلو لعلوم البيانات بجامعة كاليفورنيا في سان دييغوناقش كيف يمكن استخدام النماذج التوليدية في دراسة علوم المناخ.

بدأ الدكتور تورك، الخبير في رؤية الكمبيوتر والتفاعل بين الإنسان والحاسوب، الجلسة بتمييز الذكاء الاصطناعي التوليدي عن جميع أنواع الذكاء الاصطناعي. "في قلب تطبيقات الذكاء الاصطناعي التوليدية توجد نماذج توليدية مكونة من شبكات عصبية عميقة تتعلم بنية بيانات التدريب الضخمة الخاصة بها ثم تولد بيانات جديدة بناءً على ما تعلمته."

كما أوضح الدكتور تورك المخاوف الشائعة بشأن الأنظمة التوليدية، سواء بسبب فشل الأنظمة نفسها، مثل تلك التي تقتبس ملخصات قانونية غير موجودة، أو أيضًا بسبب استخدامها من قبل جهات فاعلة سيئة لإنشاء محتوى مزيف، مثل المحتوى الصوتي أو المحتوى المزيف. فيديو للسياسيين أو المشاهير.

قال الدكتور تورك: "على وجه التحديد، ستركز هذه الجلسة على استخدام الذكاء الاصطناعي التوليدي في العلوم، كقوة تحويلية في السعي وراء العلوم وأيضًا كخطر محتمل للتعطيل."

بدأت الدكتورة ريبيكا ويليت عرضها التقديمي بتوضيح كيفية الاستفادة من الذكاء الاصطناعي التوليدي لدعم عملية الاكتشاف العلمي. ركزت أولاً على كيفية عمل النماذج التوليدية. تعرض الصورة أدناه من شرائح الدكتور ويليت كيف يقوم نموذج اللغة، مثل ChatGPT، بتقييم احتمالية حدوث كلمة، في ضوء مجموعة سابقة من الكلمات، وكيف يقوم نموذج توليد الصور، مثل DALL-E 2، بإنشاء صورة من موجه معين باستخدام التوزيعات الاحتمالية المستفادة من مليارات الصور أثناء التدريب.

"باستخدام مبدأ التوزيعات الاحتمالية هذا، الذي يكمن وراء جميع النماذج التوليدية، يمكن تطبيق هذه النماذج على الأفكار الرائدة في العلوم، مثل توليد سيناريوهات مناخية محتملة في ضوء المناخ الحالي والسياسات المحتملة، أو توليد ميكروبيومات جديدة ذات وظائف مستهدفة، مثل يقول الدكتور ويليت: "إنها فعالة بشكل خاص في تحطيم المواد البلاستيكية".

ومع ذلك، لا يكفي استخدام الأدوات التوليدية الجاهزة، مثل ChatGPT أو DALL-E 2 للبحث العلمي. تم إنشاء هذه الأدوات في بيئة مختلفة تمامًا عن السياق الذي يعمل فيه العلماء. أحد الاختلافات الواضحة بين النموذج التوليدي الجاهز والنموذج العلمي هو البيانات. في العلوم، غالبًا ما يكون هناك القليل جدًا من البيانات التي يمكن بناء الفرضيات عليها. تأتي البيانات العلمية عادةً من عمليات المحاكاة والتجارب، وكلاهما غالبًا ما يكون مكلفًا ويستغرق وقتًا طويلاً. وبسبب هذه القيود، يتعين على العلماء أن يختاروا بعناية التجارب التي سيتم إجراؤها وكيفية تعظيم كفاءة وفائدة هذه الأنظمة. في المقابل، تولي النماذج الجاهزة أهمية أقل بكثير للمصدر الذي تأتي منه البيانات، وتفضل تعظيم كمية البيانات التي يمكنها العمل عليها. وفي العلوم، تشكل دقة مجموعات البيانات وأصولها أهمية بالغة، لأن العلماء يحتاجون إلى تبرير أبحاثهم بأدلة تجريبية قوية.

يقول الدكتور ويليت: "بالإضافة إلى ذلك، في العلوم، تختلف أهدافنا عن مجرد إنتاج أشياء معقولة". "يجب أن نفهم الطريقة التي تعمل بها الأشياء خارج نطاق ما لاحظناه حتى الآن." ويتعارض هذا النهج مع نماذج الذكاء الاصطناعي التوليدية التي تتعامل مع البيانات باعتبارها ممثلة لمجموعة كاملة من الملاحظات المحتملة. يساعد دمج النماذج والقيود المادية في الذكاء الاصطناعي التوليدي على ضمان تمثيل الظواهر الفيزيائية بشكل أفضل.

ويجب أن تكون النماذج العلمية أيضًا قادرة على التقاط الأحداث النادرة. "يمكننا تجاهل الكثير من الأحداث النادرة بأمان عندما نقوم بتدريب ChatGPT، ولكن في المقابل، غالبًا ما تكون الأحداث النادرة هي أكثر ما نهتم به في سياق العلوم، كما هو الحال في نموذج المناخ الذي يتنبأ بأحداث الطقس النادرة. إذا استخدمنا نموذجًا توليديًا يتجنب الأحداث النادرة، وعلى سبيل المثال، لا يتنبأ أبدًا بحدوث إعصار، فلن يكون هذا النموذج مفيدًا جدًا في الممارسة العملية.

ومن التحديات ذات الصلة تطوير نماذج الذكاء الاصطناعي التوليدية للعمليات الفوضوية، والتي تكون حساسة للظروف الأولية. عرض الدكتور ويليت الفيديو أدناه، والذي يظهر جسيمين يتحركان في الفضاء وفقًا لمعادلات لورينز 63. هذه المعادلات حتمية وليست عشوائية، ولكن بالنظر إلى موقعي بداية مختلفين قليلاً، يمكنك أن ترى أنه في أي وقت قد يكون الجسيمان في موقعين مختلفين تمامًا. إن تطوير نماذج الذكاء الاصطناعي التوليدية التي تتنبأ بالمسار الدقيق لمثل هذه العمليات، والتي تنشأ في علوم المناخ، والاضطرابات، وديناميكيات الشبكات، أمر صعب في الأساس، ولكن الأساليب الجديدة للنمذجة التوليدية من الممكن أن تضمن مشاركة العمليات المولدة في الخصائص الإحصائية الرئيسية مع البيانات العلمية الحقيقية.

[المحتوى جزءا لا يتجزأ]

أخيرًا، تناول الدكتور ويليت حقيقة أن البيانات العلمية غالبًا ما تمتد إلى نطاق هائل من المقاييس المكانية والزمانية. على سبيل المثال، في علم المواد، يدرس الباحثون المواد على مقياس النانومتر للمونيمرات وصولاً إلى النظام واسع النطاق، مثل الطائرة بأكملها. "هذا النطاق من المقاييس يختلف تمامًا عن البيانات المستخدمة في النماذج الجاهزة، ونحن بحاجة إلى النظر في كيفية بناء هذه النماذج التوليدية بطريقة تؤثر بدقة على هذه التفاعلات بين المقاييس".

يقول الدكتور ويليت: "النماذج التوليدية هي مستقبل العلوم، ولكن لضمان استخدامها بفعالية، نحتاج إلى تحقيق تقدم أساسي في الذكاء الاصطناعي والذهاب إلى ما هو أبعد من توصيل البيانات إلى ChatGPT".

شكرًا جزيلاً لك على القراءة، ويرجى الاستماع غدًا لقراءة ملخص عرض الدكتور ماركوس بوهلر حول الذكاء الاصطناعي التوليدي في علم الأحياء الميكانيكي.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة