לוגו זפירנט

סיכום הבטחות ומלכודות - חלק ראשון » בלוג CCC

תאריך:

CCC תמכה בשלושה מפגשים מדעיים בכנס השנתי של AAAS השנה, ובמקרה שלא הצלחת להשתתף באופן אישי, נסכם כל מפגש. השבוע נסכם את עיקרי המפגש, "AI גנרטיבי במדע: הבטחות ומלכודות." בחלק הראשון נסכם את המבוא והמצגת של ד"ר רבקה ווילט.

פאנל ה-AAAS הראשון של CCC במפגש השנתי של 2024 התקיים ביום שישי, 16 בפברואר, היום השני של הכנס. הפאנל, בהנחייתו של CCC עצמו ד"ר מתיו טורק, נשיא המכון הטכנולוגי של טויוטה בשיקגו, היה מורכב ממומחים המיישמים בינה מלאכותית במגוון תחומים מדעיים. ד"ר רבקה ווילט, פרופסור לסטטיסטיקה ומדעי המחשב באוניברסיטת שיקגו, מיקדה את המצגת שלה כיצד ניתן להשתמש במודלים גנרטיביים במדעים ומדוע מודלים מהמדף אינם מספיקים ליישום במחקר מדעי. ד"ר מרקוס בוהלר, פרופסור להנדסה במכון הטכנולוגי של מסצ'וסטס, דיבר על מודלים גנרטיביים כפי שיושמו על מדעי החומרים, ו ד"ר דאנקן ווטסון-פאריס, עוזר פרופסור ב-Scripps Institution of Oceanography ובמכון Halıcıoğlu Data Science באוניברסיטת קליפורניה סן דייגו, דנו כיצד ניתן להשתמש במודלים גנרטיביים בחקר מדעי האקלים.

ד"ר טורק, מומחה בראייה ממוחשבת ואינטראקציה בין אדם למחשב, החל את הפאנל בהבחנה של AI Generative מכל AI. "בליבה של יישומי AI גנרטיביים הם מודלים גנרטיביים המורכבים מרשתות עצביות עמוקות שלומדות את המבנה של נתוני האימון הנרחבים שלהן ואז מייצרות נתונים חדשים על סמך מה שהם למדו."

ד"ר טורק גם תיאר חששות פופולריים לגבי מערכות יצירתיות, הן בשל כשלים של המערכות עצמן, כגון אלה שמצטטות תקצירים משפטיים שאינם קיימים, והן בשל השימוש בהם על ידי שחקנים גרועים ליצירת תוכן מזויף, כגון זה של אודיו מזויף או סרטון של פוליטיקאים או מפורסמים.

"באופן ספציפי", אמר ד"ר טורק, "המפגש הזה יתמקד בשימוש בבינה מלאכותית מחוללת במדע, הן ככוח טרנספורמטיבי במרדף אחר המדע והן כסיכון פוטנציאלי להפרעה".

ד"ר רבקה ווילט החלה את המצגת שלה בהתאר כיצד ניתן למנף בינה מלאכותית גנרטיבית כדי לתמוך בתהליך הגילוי המדעי. תחילה היא התמקדה כיצד פועלים מודלים גנרטיביים. התמונה למטה מתוך השקופיות של ד"ר ווילט מציגה כיצד מודל שפה, כגון ChatGPT, מעריך את ההסתברות להתרחשות של מילה, בהינתן קבוצה קודמת של מילים, וכיצד מודל יצירת תמונה, כגון DALL-E 2, יוצר תמונה מהנחיה נתונה באמצעות התפלגויות הסתברות שנלמדו ממיליארדי תמונות במהלך האימון.

"באמצעות עיקרון זה של התפלגויות הסתברות, העומד בבסיס כל המודלים הגנרטיביים, ניתן ליישם את המודלים הללו על רעיונות צילום ירח במדעים, כגון יצירת תרחישי אקלים אפשריים בהתחשב באקלים הנוכחי ובמדיניות הפוטנציאלית, או יצירת מיקרוביומים חדשים עם פונקציונליות ממוקדת, כגון כזה שיעיל במיוחד בפירוק פלסטיק", אומר ד"ר וילט.

עם זאת, אין זה מספיק להשתמש בכלים יצירתיים מהמדף, כגון ChatGPT או DALL-E 2 למחקר מדעי. כלים אלה נוצרו בסביבה שונה מאוד מההקשר שבו פועלים מדענים. הבדל ברור אחד בין מודל יצירתי מהמדף למודל מדעי הוא הנתונים. במדע, לעתים קרובות יש מעט מאוד נתונים שעליהם ניתן לבסס השערות. נתונים מדעיים מגיעים בדרך כלל מסימולציות וניסויים, שניהם לרוב יקרים וגוזלים זמן. בגלל מגבלות אלו, מדענים צריכים לבחור בקפידה אילו ניסויים להפעיל וכיצד למקסם את היעילות והתועלת של מערכות אלו. מודלים מהמדף, לעומת זאת, מייחסים הרבה פחות חשיבות למקום ממנו מגיעים הנתונים, בהעדפה למקסום כמות הנתונים שהם יכולים לפעול לפיהם. במדע, הדיוק של מערכי הנתונים והמקורות שלהם חשובים להפליא, מכיוון שמדענים צריכים להצדיק את המחקר שלהם עם ראיות אמפיריות חזקות.

"בנוסף, במדעים, המטרות שלנו שונות מסתם לייצר דברים סבירים", אומר ד"ר ווילט. "עלינו להבין את הדרך שבה דברים עובדים מחוץ לטווח של מה שצפינו עד כה." גישה זו עומדת בסתירה למודלים של בינה מלאכותית המתייחסת לנתונים כמייצגים את כל מגוון התצפיות הסבירות. שילוב מודלים ומגבלות פיזיים ב-AI גנרטיבי עוזר להבטיח שהוא ייצג טוב יותר תופעות פיזיות.

מודלים מדעיים חייבים גם להיות מסוגלים ללכוד אירועים נדירים. "אנחנו יכולים להתעלם בבטחה מהרבה אירועים נדירים כשאנחנו מתאמנים ב-ChatGPT, אבל לעומת זאת, אירועים נדירים הם לרוב מה שהכי חשוב לנו בהקשר של המדעים, כמו למשל במודל אקלים שמנבא אירועי מזג אוויר נדירים. אם נשתמש במודל מחולל שנמנע מאירועים נדירים ולדוגמה, לעולם לא חוזה הוריקן, אז המודל הזה לא יהיה שימושי במיוחד בפועל".

אתגר קשור הוא פיתוח מודלים של AI גנרטיביים לתהליכים כאוטיים, הרגישים לתנאים ראשוניים. ד"ר ווילט הציג את הסרטון למטה, המציג שני חלקיקים נעים בחלל לפי משוואות לורנץ 63. המשוואות הללו דטרמיניסטיות, לא אקראיות, אבל בהינתן שני מיקומי התחלה שונים במקצת, אתה יכול לראות שבכל זמן נתון שני החלקיקים עשויים להיות במקומות שונים מאוד. פיתוח מודלים גנרטיביים של AI המנבאים את המהלך המדויק של תהליכים כאלה, המתעוררים במדעי האקלים, מערבולות ודינמיקה ברשת, הוא קשה ביסודו, אבל גישות חדשניות למידול גנרטיבי יכולות להבטיח שתהליכים שנוצרים חולקים מאפיינים סטטיסטיים מרכזיים עם נתונים מדעיים אמיתיים.

[תוכן מוטבע]

לבסוף, ד"ר ווילט התייחס לעובדה שנתונים מדעיים משתרעים על פני טווח עצום של קנה מידה מרחבי וזמני. לדוגמה, במדעי החומרים, חוקרים לומדים חומרים בקנה מידה ננומטרי עבור מונימרים עד למערכת בקנה מידה גדול, כמו מטוס שלם. "טווח קנה המידה הזה שונה מאוד מהנתונים המשמשים במודלים מהמדף, ועלינו לשקול כיצד אנו בונים את המודלים הגנרטיביים הללו באופן שמשפיע במדויק על האינטראקציות הללו בין סולמות".

"מודלים גנרטיביים הם העתיד של המדע", אומר ד"ר ווילט, "אבל כדי להבטיח שהם ינוצלו בצורה יעילה, אנחנו צריכים לעשות התקדמות בסיסית ב-AI ולעבור מעבר לחיבור נתונים ל-ChatGPT".

תודה רבה שקראתם, ובבקשה הצטרפו מחר כדי לקרוא את תקציר המצגת של ד"ר מרקוס בוהלר על AI Generative in Mechanobiology.

ספוט_ימג

המודיעין האחרון

ספוט_ימג