Λογότυπο Zephyrnet

Η Google δημιουργεί έναν παράγοντα AI που μαθαίνει να γενικεύεται σε νέα περιβάλλοντα αγνοώντας τους περισπασμούς

Ημερομηνία:


Σε μια μελέτη νωρίτερα φέτος που έγινε αποδεκτή στο Genetic and Evolutionary Computation Conference (GECCO) 2020, οι ερευνητές της Google διερευνήσει τις ιδιότητες των πρακτόρων λογισμικού τεχνητής νοημοσύνης που χρησιμοποιούν σημεία συμφόρησης αυτοπροσοχής. Ισχυρίζονται ότι αυτοί οι πράκτορες όχι μόνο επιδεικνύουν την ικανότητα να επιλύουν δύσκολες εργασίες που βασίζονται στην όραση, αλλά ότι είναι καλύτεροι στο να αντιμετωπίζουν μικρές τροποποιήσεις των εργασιών, λόγω της τυφλότητάς τους σε λεπτομέρειες που μπορεί να τους μπερδέψουν.

Η απροσεξία τύφλωση είναι το φαινόμενο που κάνει ένα άτομο να χάνει πράγματα σε κοινή θέα. είναι συνέπεια της επιλεκτικής προσοχής, ενός μηχανισμού που πιστεύεται ότι επιτρέπει στους ανθρώπους να συμπυκνώνουν τις πληροφορίες σε μια μορφή αρκετά συμπαγή για λήψη αποφάσεων. Φωτιστικά όπως Γιάν Λεκούν ισχυρίζονται ότι μπορεί να εμπνεύσει το σχεδιασμό συστημάτων τεχνητής νοημοσύνης που μιμούνται καλύτερα την κομψότητα και την αποτελεσματικότητα των βιολογικών οργανισμών.

Ο προτεινόμενος αντιπρόσωπος των ερευνητών της Google — AttentionAgent — στοχεύει να αφιερώσει το μεγαλύτερο μέρος της προσοχής του σε στοιχεία που σχετίζονται με την εργασία, αγνοώντας τους περισπασμούς. Για να επιτευχθεί αυτό, το σύστημα τμηματοποιεί τις εικόνες εισόδου σε ενημερωμένες εκδόσεις κώδικα και βασίζεται σε μια αρχιτεκτονική αυτο-προσοχής για να «ψηφίσει» τις ενημερώσεις κώδικα και να επιλέξει ένα υποσύνολο. Οι επιλεγμένες ενημερώσεις κώδικα καθοδηγούν τις ενέργειες του AttentionAgent καθώς ενημερώνεται για τις αλλαγές στα δεδομένα εισόδου, παρακολουθώντας πώς εξελίσσονται σημαντικοί παράγοντες με την πάροδο του χρόνου.

Google AttentionAgent

Πάνω: VizDoom: Το AttentionAgent εκπαιδεύεται στο περιβάλλον χωρίς τροποποιήσεις (αριστερά). Είναι σε θέση να προσαρμόζεται σε αλλαγές στο περιβάλλον, όπως ένας ψηλότερος τοίχος (μέση αριστερά), μια διαφορετική υφή δαπέδου (μέση δεξιά) ή αιωρούμενο κείμενο (δεξιά).

Σε πειράματα, η ομάδα έδειξε ότι το AttentionAgent έμαθε να παρακολουθεί μια σειρά από περιοχές στις εικόνες. Για παράδειγμα, το εκπαίδευσαν ώστε να επιβιώνει σε ένα επίπεδο μέσα στο VizDoom, ένα ψηφιακό ερευνητικό περιβάλλον βασισμένο στο παιχνίδι shooter πρώτου προσώπου Doom, ακόμη και σε περιβάλλοντα με τοίχους, υφές δαπέδου και σήμανση που δεν είχε συναντήσει πριν. Και στο παιχνίδι CarRacing στο OpenAI's Gym, μια εργαλειοθήκη για την ανάπτυξη και σύγκριση αλγορίθμων ενισχυτικής μάθησης, το AttentionAgent έμαθε να οδηγεί κατά τη διάρκεια μιας ηλιόλουστης ημέρας και να μεταφέρει τις δεξιότητές του στην οδήγηση τη νύχτα, μια βροχερή μέρα, σε διαφορετικό αυτοκίνητο, με πιο φωτεινά ή πιο σκοτεινά τοπία και παρουσία εικαστικών αντικειμένων. Ίσως πιο εντυπωσιακό, η εκπαίδευση στο CarRacing απαιτούσε 1,000 φορές λιγότερες παραμέτρους - τις εσωτερικές μεταβλητές του συστήματος που παρέχουν τις προβλέψεις του - από τις συμβατικές μεθόδους που αποτυγχάνουν να γενικεύσουν.

VB Transform 2020 Online - 15-17 Ιουλίου. Γίνετε μέλος των κορυφαίων στελεχών της AI: Εγγραφείτε για τη δωρεάν ζωντανή ροή.

Google AttentionAgent

Πάνω: CarRacing: Καμία τροποποίηση (αριστερά). διαταραχή χρώματος (μέση αριστερά). κάθετες ράβδοι αριστερά και δεξιά (μέση δεξιά). προστέθηκε κόκκινη σταγόνα (δεξιά).

Παρά τα ενθαρρυντικά αποτελέσματα, οι ερευνητές σημειώνουν ότι το AttentionAgent έχει σοβαρούς περιορισμούς. Δεν γενικεύεται σε περιπτώσεις όπου εμπλέκονται «δραματικές» αλλαγές στο υπόβαθρο, για παράδειγμα. ένας πράκτορας που εκπαιδεύτηκε στο CarRacing με φόντο πράσινο γρασίδι απέτυχε να γενικεύσει όταν το φόντο αντικαταστάθηκε με βίντεο YouTube που αποσπούν την προσοχή. Όταν το φόντο αντικαταστάθηκε με ομοιόμορφο θόρυβο, ο πράκτορας παρακολουθούσε τυχαία τμήματα θορύβου. Και ενώ η εκπαίδευση ενός πράκτορα από την αρχή με το θορυβώδες φόντο του επέτρεψε να κυκλοφορεί στην πίστα, η απόδοσή του ήταν μέτρια.

Google AttentionAgent

Πάνω: Το AttentionAgent αποτυγχάνει να γενικεύσει σε δραστικά τροποποιημένα περιβάλλοντα.

Για να παρακινήσουν τη μελλοντική, βελτιωμένη εργασία στην επιλεκτική προσοχή, οι ερευνητές κυκλοφόρησαν μια σειρά εργασιών αγώνων αυτοκινήτων που περιλαμβάνουν περιβαλλοντικές τροποποιήσεις. Χιονίζει διαθέσιμο σε ανοιχτό κώδικα στο GitHub. «Η απλοϊκή μέθοδος που χρησιμοποιούμε για να εξάγουμε πληροφορίες από σημαντικές ενημερώσεις κώδικα μπορεί να είναι ανεπαρκής για πιο περίπλοκες εργασίες», έγραψαν οι συγγραφείς Yujin Tang, μηχανικός ερευνητικού λογισμικού στην Google και ο David Ha, ερευνητής του προσωπικού της Google Research στο Τόκιο. "Το πώς μπορούμε να μάθουμε πιο ουσιαστικά χαρακτηριστικά και ίσως ακόμη και να εξάγουμε συμβολικές πληροφορίες από την οπτική είσοδο θα είναι μια συναρπαστική μελλοντική κατεύθυνση."

Source: http://feedproxy.google.com/~r/venturebeat/SZYF/~3/3u2a9UP05ZY/

spot_img

Τελευταία Νοημοσύνη

spot_img