Λογότυπο Zephyrnet

Οι φωτοανιχνευτές μιμούνται τον αμφιβληστροειδή για να επιτρέψουν την ενεργειακά αποδοτική οπτική αναγνώριση

Ημερομηνία:

15 Φεβρουαρίου 2024 (Προβολέας Nanowerk) Η αποτελεσματική μίμηση των απαράμιλλων οπτικών ικανοτήτων του ανθρώπινου εγκεφάλου ενώ λειτουργεί με αυστηρούς ενεργειακούς περιορισμούς αποτελεί μια τρομερή πρόκληση για τεχνητή νοημοσύνη προγραμματιστές. Το ανθρώπινο οπτικό σύστημα επεξεργάζεται κομψά οπτικά δεδομένα χρησιμοποιώντας σύντομους ηλεκτρικούς παλμούς που ονομάζονται αιχμές, που μεταδίδονται μεταξύ των νευρώνων. Αυτός ο αιχμηρός νευρικός κώδικας στηρίζει την απαράμιλλη αναγνώριση προτύπων μας χρησιμοποιώντας περιορισμένους υπολογιστικούς πόρους. Ωστόσο, η σύγχρονη μηχανική όραση συνεπάγεται ουσιαστική επεξεργασία των οπτικών εισόδων από αισθητήρες που χρειάζονται ενέργεια σε αναπαραστάσεις εύπεπτες για αλγόριθμους υπολογιστών. Αυτή η υπολογιστική ένταση περιορίζει την ανάπτυξη συστημάτων όρασης που λειτουργούν συνεχώς σε κινητά και το διαδίκτυο των πραγμάτων πλαίσια. Η αναζήτηση εναλλακτικών βιοεμπνευσμένων αρχιτεκτονικών που εξισορροπούν καλύτερα την οπτική νοημοσύνη με την ενεργειακή απόδοση έχει αναλόγως ενταθεί. Προηγουμένως, οι ερευνητές αγωνίστηκαν να μεταφράσουν τα βασικά πλεονεκτήματα της βιολογικής όρασης σε τεχνητά συστήματα. Οι προσαρμοσμένες κάμερες και αισθητήρες ακίδας συχνά θυσιάζουν την ποιότητα της εικόνας ενώ απαιτούν επιπλέον στοιχεία για την κωδικοποίηση οπτικών εισόδων ως αιχμές. Εν τω μεταξύ, οι αλγόριθμοι που μιμούνται τους αιχμηρούς νευρώνες σπάνια ταιριάζουν με την αποτελεσματικότητα των βιολογικών ομολόγων τους όταν εκτελούνται σε συμβατικό υλικό υπολογιστή. Αυτοί οι περιορισμοί έχουν εμποδίσει την ανάπτυξη τεχνητά ευφυών συστημάτων όρασης που συνδυάζουν τις οπτικές δυνατότητες της υπερσύγχρονης όρασης υπολογιστή με τη χαμηλή κατανάλωση ενέργειας των νευρωνικών δικτύων αιχμής. Τώρα, ερευνητές από το Πανεπιστήμιο Τεχνολογίας του Πεκίνου αναφέρουν (Προηγμένων Υλικών, «Αρχιτεκτονική τεχνητής όρασης που βασίζεται στην πλήρη μίμηση του ανθρώπινου οράματος») ένα πολλά υποσχόμενο σύστημα τεχνητής όρασης που βασίζεται σε spiking που μιμείται βασικές πτυχές της βιολογικής όρασης σε κυκλώματα πυριτίου. Το νέο τους τσιπ φωτοενεργού νευρωνικού δικτύου μετατρέπει το φως απευθείας σε αιχμές ηλεκτρικού ρεύματος ενώ παρουσιάζει επιλεκτικότητα των κυττάρων του αμφιβληστροειδούς για οπτική αλλαγή έναντι στατικών εισόδων. Χρησιμοποιώντας αυτή τη βιοεμπνευσμένη προσέγγιση που αναλύει ζωντανές εικόνες, η ομάδα πέτυχε πάνω από 90% ακρίβεια αναγνωρίζοντας τις χειρονομίες με ένα στοιχειώδες νευρωνικό δίκτυο μετά από οριακή εκπαίδευση. Αρχιτεκτονικές τεχνητής όρασης που βασίζονται στην πλήρη αντιγραφή και επικόλληση της ανθρώπινης όρασης Αρχιτεκτονικές τεχνητής όρασης που βασίζονται στην πλήρη αντιγραφή και επικόλληση της ανθρώπινης όρασης. a Το ανθρώπινο οπτικό σύστημα, που αποτελείται από τον αμφιβληστροειδή (spiking encoding) και τον εγκέφαλο (επεξεργασία πληροφοριών). b Η νέα στρατηγική τεχνητής όρασης που βασίζεται σε spiking, που αποτελείται από τον φωτοανιχνευτή spiking (spiking encoding) και την τεχνητή σύναψη (επεξεργασία πληροφοριών). (Εικόνα: Ανατύπωση με άδεια από την Wiley-VCH Verlag) Στον πυρήνα αυτής της καινοτομίας βρίσκονται εξειδικευμένα κυκλώματα φωτοανιχνευτών που εξάγουν αιχμές ηλεκτρικού ρεύματος ως απόκριση στα μεταβαλλόμενα επίπεδα φωτός, μιμούμενοι τα κύτταρα του αμφιβληστροειδούς στο ανθρώπινο μάτι. Σε αντίθεση με μια τυπική ψηφιακή φωτογραφική μηχανή που εξάγει μια σταθερή ροή δεδομένων εικονοστοιχείων ανεξάρτητα από το περιεχόμενο εικόνας, αυτοί οι «φωτοανιχνευτές αιχμής» παραμένουν ανενεργοί κατά την προβολή στατικών σκηνών, πυροδοτώντας αιχμές μόνο για κινούμενα ή πρόσφατα ορατά αντικείμενα που χρειάζονται κωδικοποίηση. Αυτή η επιλεκτική συμπεριφορά αιχμής επιτρέπει την αποτελεσματική αναπαράσταση πληροφοριών παρόμοια με τη νευρική κωδικοποίηση οπτικών ερεθισμάτων στον ανθρώπινο αμφιβληστροειδή. Αντί να καταγράφουν τα απόλυτα επίπεδα φωτός σε μια ολόκληρη σκηνή, οι φωτοανιχνευτές και οι βιολογικοί τους αντίστοιχοι ανταποκρίνονται κυρίως στις αλλαγές του επιπέδου φωτός μέσα στο δεκτικό τους πεδίο. Οι ερευνητές προτείνουν ότι το φιλτράρισμα αμετάβλητων και πιθανώς ασήμαντων στοιχείων εικόνας φόντου επιτρέπει την εξαιρετική αναγνώριση προτύπων της βιολογικής όρασης χρησιμοποιώντας περιορισμένους νευρικούς πόρους. Σε δοκιμές, οι φωτιζόμενες συστοιχίες αυτών των εικονοστοιχείων που βασίζονται σε συμβάντα με συμβολικά γραφικά και χειρονομίες με ποικίλη δυναμική προκάλεσαν μοτίβα ακίδων που περιέχουν επαρκείς πληροφορίες για επακόλουθη ταξινόμηση με απλή επεξεργασία νευρωνικών δικτύων. Για παράδειγμα, η μετατροπή της ορθογραφίας των δακτύλων της αμερικανικής νοηματικής γλώσσας σε αιχμές επέτρεψε την ταχεία ταυτοποίηση τεσσάρων διακριτών γραμμάτων από το νευρωνικό δίκτυο χρησιμοποιώντας μόνο 50 δείγματα εκπαίδευσης ανά γράμμα. Είναι σημαντικό ότι οι καθιερωμένες τεχνικές βαθιάς εκμάθησης πέτυχαν συγκρίσιμη ακρίβεια μόνο μετά την επεξεργασία εκτεταμένων ακολουθιών καρέ από πολύ πιο απαιτητικές ψηφιακές φωτογραφικές μηχανές και μονάδες επεξεργασίας γραφικών. Παρομοίως, κατά την αξιολόγηση του συστήματός τους σε ένα τυποποιημένο σύνολο δεδομένων ανθρώπινης δραστηριότητας, τα εικονοστοιχεία φωτοανιχνευτή ακίδα εξήγαγαν επαρκείς αποχρώσεις στάσης και κίνησης από μόλις τέσσερα αραιά δυαδικά καρέ σιλουέτας ανά βίντεο. Η τροφοδοσία αυτών των συμπυκνωμένων αναπαραστάσεων ακίδων ενεργειών όπως το άλμα και το κυματισμό σε έναν βασικό ταξινομητή νευρωνικών δικτύων επέτρεψε την αναγνώριση με ακρίβεια 90% μετά από μόνο πέντε εποχές εκπαίδευσης. Η αντιστοίχιση αυτού του σημείου αναφοράς απαιτεί συνήθως την ανάλυση χιλιάδων φωτογραφιών βίντεο υψηλής ανάλυσης με περίτεχνα σχεδιασμένα βαθιά νευρωνικά δίκτυα. Για να χειριστεί εργασίες αναγνώρισης εικόνων, η ομάδα κατασκεύασε το βιο-εμπνευσμένο κύκλωμά της ενσωματώνοντας συναπτικές συσκευές που είχαν αναπτυχθεί προηγουμένως για αιχμηρούς νευρομορφικούς επεξεργαστές. Αυτές οι τεχνητές συνάψεις μιμούνται την ρυθμιζόμενη ισχύ σύνδεσης μεταξύ βιολογικών νευρώνων, παρέχοντας ρυθμίσιμη μνήμη για να καταστεί δυνατή η μάθηση. Εφαρμόζοντας παλμούς προγραμματισμού, οι ερευνητές ζύγισαν κατάλληλα τις συνάψεις που λαμβάνουν αιχμές από τους φωτοανιχνευτές, διδάσκοντας στο δίκτυο να ταξινομεί βασικούς συνδυασμούς σχημάτων και μοτίβων κίνησης. Οι σαφείς διαφορές μετά την προπόνηση στις τιμές αγωγιμότητας των συνάψεων αντιστοιχούσαν σε μοναδικά χαρακτηριστικά αναγνώρισης εντός των οπτικών ερεθισμάτων. Συνολικά, τα αποτελέσματα δείχνουν σημαντικά βήματα προς τον αποτελεσματικό νευρομορφικό υπολογισμό χρησιμοποιώντας τις αρχές σχεδιασμού του εγκεφάλου. Η αναπαράσταση πληροφοριών βάσει συμβάντων αντιμετωπίζει βασικούς περιορισμούς για την ανάπτυξη τεχνητής νοημοσύνης σε κινητές πλατφόρμες και άλλα περιβάλλοντα περιορισμένης ισχύος. Προσβλέποντας στο μέλλον, οι ερευνητές στοχεύουν να συνεχίσουν να αναπτύσσουν την αρχιτεκτονική τους για πρακτικές εφαρμογές μηχανικής όρασης. Με διευρυμένες συστοιχίες υψηλότερης ανάλυσης για τη λήψη πλουσιότερων οπτικών δεδομένων με ρυθμούς καρέ που ταιριάζουν με την ανθρώπινη αντίληψη, τα συστήματα όρασης εμπνευσμένα από βιολόγους θα μπορούσαν να γίνουν πανταχού παρόντα. Η βελτιστοποιημένη μετάδοση δεδομένων βάσει ακίδων από διάφορους υπάρχοντες αισθητήρες θα κάλυπτε περαιτέρω το χάσμα με τις βιολογικές ικανότητες. Για την αυτόνομη πλοήγηση οχημάτων, τις διεπαφές επαυξημένης πραγματικότητας, τη ρομποτική και άλλες σφαίρες που αναμένεται να οδηγήσουν στη μελλοντική αύξηση της ζήτησης για υλικό όρασης υπολογιστών, οι ταυτόχρονες βελτιώσεις στην ικανότητα και την αποτελεσματικότητα παραμένουν επιτακτική.


Μάικλ Μπέργκερ
By

Μιχαήλ
Berger



– Ο Michael είναι συγγραφέας τριών βιβλίων από τη Royal Society of Chemistry:
Νανο-κοινωνία: Προώθηση των ορίων της τεχνολογίας,
Νανοτεχνολογία: Το μέλλον είναι μικροσκοπικό, να
Νανομηχανική: Οι δεξιότητες και τα εργαλεία που καθιστούν την τεχνολογία αόρατη
Copyright ©


Nanowerk LLC

Γίνετε συγγραφέας προσκεκλημένων! Εγγραφείτε στη μεγάλη και αναπτυσσόμενη ομάδα μας συμμετέχοντες. Μόλις δημοσιεύσατε μια επιστημονική εργασία ή έχετε άλλες συναρπαστικές εξελίξεις για κοινή χρήση με την κοινότητα νανοτεχνολογίας; Δείτε πώς μπορείτε να δημοσιεύσετε στο nanowerk.com.

spot_img

Τελευταία Νοημοσύνη

spot_img