Logo Zéphyrnet

Les photodétecteurs à pointes imitent la rétine pour permettre une reconnaissance visuelle économe en énergie

Date :

15 février 2024 (Projecteur Nanowerk) Imiter efficacement les capacités visuelles inégalées du cerveau humain tout en fonctionnant dans des contraintes énergétiques strictes pose un formidable défi pour intelligence artificielle développeurs. Le système visuel humain traite avec élégance les données optiques à l’aide de brèves impulsions électriques appelées pointes, transmises entre les neurones. Ce code neuronal à pointe sous-tend notre reconnaissance de formes sans précédent en utilisant des ressources informatiques limitées. Cependant, la vision industrielle contemporaine implique un traitement substantiel des entrées visuelles provenant de capteurs gourmands en énergie en représentations digestibles pour les algorithmes informatiques. Cette intensité de calcul limite le déploiement de systèmes de vision fonctionnant en continu dans les environnements mobiles et Internet des objets contextes. La recherche d’architectures alternatives bioinspirées, qui équilibrent mieux l’intelligence visuelle et l’efficacité énergétique, s’est donc intensifiée. Auparavant, les chercheurs avaient eu du mal à traduire les principaux avantages de la vision biologique en systèmes artificiels. Les caméras et capteurs de pointe personnalisés sacrifient souvent la qualité de l'image tout en nécessitant des composants supplémentaires pour coder les entrées visuelles sous forme de pointes. Pendant ce temps, les algorithmes imitant les neurones à pointes atteignent rarement l’efficacité de leurs homologues biologiques lorsqu’ils fonctionnent sur du matériel informatique conventionnel. Ces limitations ont bloqué le développement de systèmes de vision artificiellement intelligents combinant les capacités visuelles de la vision par ordinateur de pointe avec la faible consommation d'énergie des réseaux neuronaux de pointe. Aujourd'hui, des chercheurs de l'Université de technologie de Pékin rapportent (Matériaux avancés, « Une architecture de vision artificielle à pointes basée sur l'émulation complète de la vision humaine ») un système de vision artificielle prometteur basé sur la pointe qui émule des facettes clés de la vision biologique dans les circuits en silicium. Leur nouvelle puce de réseau neuronal photoactif convertit la lumière directement en pointes de courant électrique tout en présentant la sélectivité des cellules rétiniennes pour le changement visuel par rapport aux entrées statiques. Grâce à cette approche bioinspirée analysant des images en direct, le groupe a atteint une précision de plus de 90 % dans la reconnaissance des gestes de la main avec un réseau neuronal élémentaire après un entraînement marginal. Architectures de vision artificielle basées sur un copier-coller intégral de la vision humaine Architectures de vision artificielle basées sur un copier-coller intégral de la vision humaine. a Le système visuel humain, composé de la rétine (codage par pointe) et du cerveau (traitement de l'information). b La nouvelle stratégie de vision artificielle basée sur le pic, composée du photodétecteur de pic (codage du pic) et de la synapse artificielle (traitement de l'information). (Image : réimprimé avec la permission de Wiley-VCH Verlag) Au cœur de cette innovation se trouvent des circuits photodétecteurs spécialisés qui émettent des pics de courant électrique en réponse aux niveaux de lumière changeants, imitant les cellules rétiniennes de l'œil humain. Contrairement à un appareil photo numérique classique qui génère un flux constant de données de pixels quel que soit le contenu de l'image, ces « photodétecteurs à pointes » restent inactifs lors de la visualisation de scènes statiques, déclenchant des pointes uniquement pour les objets en mouvement ou nouvellement visibles nécessitant un codage. Ce comportement de pointe sélectif permet une représentation efficace des informations similaire au codage neuronal des stimuli visuels par la rétine humaine. Plutôt que de capturer les niveaux de lumière absolus sur l’ensemble d’une scène, les photodétecteurs à pointe et leurs homologues biologiques réagissent principalement aux changements de niveau de lumière dans leur champ de réception. Les chercheurs suggèrent que le filtrage des éléments d’image d’arrière-plan immuables et probablement sans importance permet la reconnaissance exceptionnelle des formes de la vision biologique en utilisant des ressources neuronales limitées. Lors des tests, des tableaux lumineux de ces pixels pilotés par des événements avec des graphiques symboliques et des gestes de la main de dynamique variable ont induit des modèles de pointes contenant suffisamment d'informations pour une classification ultérieure avec un simple traitement de réseau neuronal. Par exemple, la conversion de l’orthographe des doigts de la langue des signes américaine en pointes a permis une identification rapide par réseau neuronal de quatre lettres distinctes en utilisant seulement 50 échantillons d’apprentissage par lettre. Il est important de noter que les techniques d’apprentissage profond établies n’atteignaient une précision comparable qu’après avoir traité de longues séquences d’images provenant d’appareils photo numériques et d’unités de traitement graphique beaucoup plus gourmands en énergie. De même, lors de l’évaluation de leur système sur un ensemble de données standardisées sur l’activité humaine, les pixels du photodétecteur ont extrait des nuances de posture et de mouvement adéquates à partir de seulement quatre images de silhouette binaires clairsemées par vidéo. L'introduction de ces représentations condensées de pointes d'actions telles que sauter et agiter dans un classificateur de réseau neuronal de base a permis une reconnaissance avec une précision de 90 % après seulement cinq époques d'entraînement. Pour correspondre à cette référence, il faut généralement analyser des milliers d’images fixes vidéo haute résolution avec des réseaux neuronaux profonds minutieusement conçus. Pour gérer les tâches de reconnaissance d’images, l’équipe a construit ses circuits bio-inspirés en intégrant des dispositifs synaptiques précédemment développés pour alimenter les processeurs neuromorphiques. Ces synapses artificielles imitent la force de connexion réglable entre les neurones biologiques, fournissant ainsi une mémoire réglable pour permettre l'apprentissage. En appliquant des impulsions de programmation, les chercheurs ont pondéré de manière appropriée les synapses recevant les pointes des photodétecteurs, apprenant ainsi au réseau à classer les combinaisons de base de formes et de modèles de mouvement. Des différences nettes après l'entraînement dans les valeurs de conductivité synapse correspondaient à des caractéristiques d'identification uniques au sein des stimuli optiques. Dans l’ensemble, les résultats présentent des progrès majeurs vers une informatique neuromorphique efficace utilisant les principes de conception du cerveau. La représentation des informations basée sur les événements répond aux principales contraintes liées au déploiement de l'intelligence artificielle sur des plates-formes mobiles et d'autres contextes à puissance limitée. Pour l’avenir, les chercheurs visent à continuer à développer leur architecture de pointe pour des applications pratiques de vision industrielle. Avec des réseaux étendus et à plus haute résolution permettant de capturer des données visuelles plus riches à des fréquences d'images correspondant à la perception humaine, les systèmes de vision inspirés par les biologistes pourraient devenir omniprésents. La transmission optimisée de données basées sur les pointes à partir de divers capteurs existants permettrait de réduire encore davantage l’écart avec les capacités biologiques. Pour la navigation des véhicules autonomes, les interfaces de réalité augmentée, la robotique et d’autres domaines qui devraient stimuler la croissance future de la demande de matériel de vision par ordinateur, des améliorations simultanées des capacités et de l’efficacité restent impératives.


Michael Berger
By

Michael
Berger



– Michael est l'auteur de trois livres de la Royal Society of Chemistry :
Nano-société: repousser les limites de la technologie,
Nanotechnologie: l'avenir est minusculeet
Nanoingénierie: les compétences et les outils qui rendent la technologie invisible
Copyright ©


Nanowerk LLC

Devenez auteur invité Spotlight! Rejoignez notre grand groupe de contributeurs invités. Vous venez de publier un article scientifique ou avez-vous d'autres développements passionnants à partager avec la communauté des nanotechnologies? Voici comment publier sur nanowerk.com.

spot_img

Dernières informations

spot_img