לוגו זפירנט

מגשר על הפער בין ראייה אנושית למכונה

תאריך:

נניח שאתה מסתכל בקצרה ממרחק של כמה מטרים על אדם שמעולם לא פגשת לפני כן. צעד אחורה כמה צעדים והסתכל שוב. האם תוכל לזהות את פניה? "כן, כמובן," אתם בטח חושבים. אם זה נכון, פירוש הדבר שמערכת הראייה שלנו, לאחר שראתה תמונה יחידה של אובייקט כמו פנים ספציפיות, מכירה בזה בחוזקה למרות שינויים במיקום ובקנה המידה של האובייקט, למשל. מצד שני, אנו יודעים שמסווגים עדכניים, כמו רשתות עמוקות וניל, יכשלו במבחן הפשוט הזה.

על מנת לזהות פנים ספציפיות במגוון טרנספורמציות, יש להכשיר רשתות עצביות עם דוגמאות רבות לפנים בתנאים השונים. במילים אחרות, הם יכולים להשיג אובייקט באמצעות שינון, אך אינם יכולים לעשות זאת אם רק תמונה אחת זמינה. לפיכך, ההבנה כיצד החזון האנושי יכול לחלץ את ההישג המדהים הזה היא רלוונטית למהנדסים שמטרתם לשפר את המסווגים הקיימים שלהם. זה חשוב גם למדעי המוח המדגמים את מערכת הראייה הפרימאטית עם רשתות עמוקות. בפרט, יתכן שהשוויון בלמידה חד-פעמית המוצגת על ידי ראייה ביולוגית דורש אסטרטגיה חישובית שונה למדי מזו של רשתות עמוקות. 

מאמר חדש של מועמד לתואר שלישי MIT בהנדסת חשמל ומדעי המחשב ינה האן ועמיתיו דוחות מדעיים טבע תחת הכותרת "קנה מידה ושינוי תרגול לאובייקטים חדשים ברוח החזון האנושי" דנים כיצד הם חוקרים את התופעה בזהירות יותר ליצירת רשתות חדשניות בהשראת ביולוגיה.

"בני אדם יכולים ללמוד ממעט מאוד דוגמאות, בניגוד לרשתות עמוקות. זהו הבדל עצום עם השלכות עצומות על הנדסת מערכות ראייה ועל הבנת האופן שבו ראייה אנושית עובדת באמת ", קובע המחבר המשותף, טומאסו פוג'ו - מנהל המרכז למוחות, מחשבות ומכונות (CBMM) והפרופסור למוח במוח יוג'ין מקדרמוט ומדעי הקוגניציה ב- MIT. "סיבה מרכזית להבדל זה היא המשתנות היחסית של מערכת הראייה הפרימטית בקנה מידה, שינוי ותמורות אחרות. באופן מוזר, זה בעיקר הוזנח בקהילת ה- AI, בין השאר בגלל שהנתונים הפסיכופיזיים היו עד כה פחות ברורים. עבודתו של האן ביססה כעת מדידות מוצקות של תוספות בסיסיות של הראייה האנושית. "

כדי להבדיל בין חוסר השוויון העולה מחישוב מהותי לזה מהניסיון והשינון, המחקר החדש מדד את טווח ההיארעות בלמידה חד-פעמית. משימת למידה חד פעמית בוצעה על ידי הצגת גירויי אותיות קוריאניות לנושאים אנושיים שלא היו בקיאים בשפה. מכתבים אלה הוצגו בתחילה פעם אחת בתנאי ספציפי אחד ונבדקו בסולם או במיקומים שונים מהתנאי המקורי. התוצאה הניסיונית הראשונה היא שבדיוק כפי שניחשתם - בני אדם הראו הכרה משמעותית בלתי תלויה בקנה מידה לאחר חשיפה יחידה לאובייקטים חדשים אלה. התוצאה השנייה היא שטווח האי-שוויון מוגבל, תלוי בגודל האובייקטים ומיקומם.

בשלב הבא, האן ועמיתיה ערכו ניסוי דומה ברשתות עצביות עמוקות שנועדו לשחזר את ההופעה האנושית הזו. מהתוצאות עולה כי כדי להסביר את ההכרה הבלתי משתנה של עצמים על ידי בני אדם, על מודלים של רשת עצביים לשלב במפורש אי-שוויון מובנה. בנוסף, יכולת משוכפלת טוב יותר של חוסר ראייה אנושית ברשת על ידי כך ששדות הקבלה של נוירונים מודליים גדלים ככל שהם נמצאים יותר ממרכז השדה הראייתי. ארכיטקטורה זו שונה מדגמי רשת עצביים נפוצים, כאשר תמונה מעובדת ברזולוציה אחידה עם אותם פילטרים משותפים.

"העבודה שלנו מספקת הבנה חדשה של הייצוג המוחי של אובייקטים תחת נקודות מבט שונות. יש לזה השלכות על AI, מכיוון שהתוצאות מספקות תובנות חדשות לגבי מהו תכנון אדריכלי טוב לרשתות עצביות עמוקות, "מעיר האן, חוקר CBMM וכותב המחקר הראשי.

אל האן ופוג'יו הצטרפו ג'מה ריג וגד גייגר בעבודה.


מקור: http://news.mit.edu/2020/bridging-gap-between-human-and-machine-vision-0211

ספוט_ימג

המודיעין האחרון

ספוט_ימג