Σε μια μελέτη νωρίτερα φέτος που έγινε αποδεκτή στο Genetic and Evolutionary Computation Conference (GECCO) 2020, οι ερευνητές της Google διερευνήσει τις ιδιότητες των πρακτόρων λογισμικού τεχνητής νοημοσύνης που χρησιμοποιούν σημεία συμφόρησης αυτοπροσοχής. Ισχυρίζονται ότι αυτοί οι πράκτορες όχι μόνο επιδεικνύουν την ικανότητα να επιλύουν δύσκολες εργασίες που βασίζονται στην όραση, αλλά ότι είναι καλύτεροι στο να αντιμετωπίζουν μικρές τροποποιήσεις των εργασιών, λόγω της τυφλότητάς τους σε λεπτομέρειες που μπορεί να τους μπερδέψουν.
Η απροσεξία τύφλωση είναι το φαινόμενο που κάνει ένα άτομο να χάνει πράγματα σε κοινή θέα. είναι συνέπεια της επιλεκτικής προσοχής, ενός μηχανισμού που πιστεύεται ότι επιτρέπει στους ανθρώπους να συμπυκνώνουν τις πληροφορίες σε μια μορφή αρκετά συμπαγή για λήψη αποφάσεων. Φωτιστικά όπως Γιάν Λεκούν ισχυρίζονται ότι μπορεί να εμπνεύσει το σχεδιασμό συστημάτων τεχνητής νοημοσύνης που μιμούνται καλύτερα την κομψότητα και την αποτελεσματικότητα των βιολογικών οργανισμών.
Ο προτεινόμενος αντιπρόσωπος των ερευνητών της Google — AttentionAgent — στοχεύει να αφιερώσει το μεγαλύτερο μέρος της προσοχής του σε στοιχεία που σχετίζονται με την εργασία, αγνοώντας τους περισπασμούς. Για να επιτευχθεί αυτό, το σύστημα τμηματοποιεί τις εικόνες εισόδου σε ενημερωμένες εκδόσεις κώδικα και βασίζεται σε μια αρχιτεκτονική αυτο-προσοχής για να «ψηφίσει» τις ενημερώσεις κώδικα και να επιλέξει ένα υποσύνολο. Οι επιλεγμένες ενημερώσεις κώδικα καθοδηγούν τις ενέργειες του AttentionAgent καθώς ενημερώνεται για τις αλλαγές στα δεδομένα εισόδου, παρακολουθώντας πώς εξελίσσονται σημαντικοί παράγοντες με την πάροδο του χρόνου.
Σε πειράματα, η ομάδα έδειξε ότι το AttentionAgent έμαθε να παρακολουθεί μια σειρά από περιοχές στις εικόνες. Για παράδειγμα, το εκπαίδευσαν ώστε να επιβιώνει σε ένα επίπεδο μέσα στο VizDoom, ένα ψηφιακό ερευνητικό περιβάλλον βασισμένο στο παιχνίδι shooter πρώτου προσώπου Doom, ακόμη και σε περιβάλλοντα με τοίχους, υφές δαπέδου και σήμανση που δεν είχε συναντήσει πριν. Και στο παιχνίδι CarRacing στο OpenAI's Gym, μια εργαλειοθήκη για την ανάπτυξη και σύγκριση αλγορίθμων ενισχυτικής μάθησης, το AttentionAgent έμαθε να οδηγεί κατά τη διάρκεια μιας ηλιόλουστης ημέρας και να μεταφέρει τις δεξιότητές του στην οδήγηση τη νύχτα, μια βροχερή μέρα, σε διαφορετικό αυτοκίνητο, με πιο φωτεινά ή πιο σκοτεινά τοπία και παρουσία εικαστικών αντικειμένων. Ίσως πιο εντυπωσιακό, η εκπαίδευση στο CarRacing απαιτούσε 1,000 φορές λιγότερες παραμέτρους - τις εσωτερικές μεταβλητές του συστήματος που παρέχουν τις προβλέψεις του - από τις συμβατικές μεθόδους που αποτυγχάνουν να γενικεύσουν.
Παρά τα ενθαρρυντικά αποτελέσματα, οι ερευνητές σημειώνουν ότι το AttentionAgent έχει σοβαρούς περιορισμούς. Δεν γενικεύεται σε περιπτώσεις όπου εμπλέκονται «δραματικές» αλλαγές στο υπόβαθρο, για παράδειγμα. ένας πράκτορας που εκπαιδεύτηκε στο CarRacing με φόντο πράσινο γρασίδι απέτυχε να γενικεύσει όταν το φόντο αντικαταστάθηκε με βίντεο YouTube που αποσπούν την προσοχή. Όταν το φόντο αντικαταστάθηκε με ομοιόμορφο θόρυβο, ο πράκτορας παρακολουθούσε τυχαία τμήματα θορύβου. Και ενώ η εκπαίδευση ενός πράκτορα από την αρχή με το θορυβώδες φόντο του επέτρεψε να κυκλοφορεί στην πίστα, η απόδοσή του ήταν μέτρια.
Για να παρακινήσουν τη μελλοντική, βελτιωμένη εργασία στην επιλεκτική προσοχή, οι ερευνητές κυκλοφόρησαν μια σειρά εργασιών αγώνων αυτοκινήτων που περιλαμβάνουν περιβαλλοντικές τροποποιήσεις. Χιονίζει διαθέσιμο σε ανοιχτό κώδικα στο GitHub. «Η απλοϊκή μέθοδος που χρησιμοποιούμε για να εξάγουμε πληροφορίες από σημαντικές ενημερώσεις κώδικα μπορεί να είναι ανεπαρκής για πιο περίπλοκες εργασίες», έγραψαν οι συγγραφείς Yujin Tang, μηχανικός ερευνητικού λογισμικού στην Google και ο David Ha, ερευνητής του προσωπικού της Google Research στο Τόκιο. "Το πώς μπορούμε να μάθουμε πιο ουσιαστικά χαρακτηριστικά και ίσως ακόμη και να εξάγουμε συμβολικές πληροφορίες από την οπτική είσοδο θα είναι μια συναρπαστική μελλοντική κατεύθυνση."
Source: http://feedproxy.google.com/~r/venturebeat/SZYF/~3/3u2a9UP05ZY/