Logotipo de Zephyrnet

Los fotodetectores con pinchos imitan la retina para permitir un reconocimiento visual energéticamente eficiente

Fecha:

15 de febrero de 2024 (Proyector Nanowerk) Imitar eficazmente las inigualables capacidades visuales del cerebro humano mientras se opera dentro de estrictas limitaciones de energía plantea un desafío formidable para inteligencia artificial desarrolladores. El sistema visual humano procesa elegantemente datos ópticos mediante breves pulsos eléctricos denominados picos, transmitidos entre neuronas. Este código neuronal en aumento sustenta nuestro incomparable reconocimiento de patrones utilizando recursos computacionales limitados. Sin embargo, la visión artificial contemporánea implica un procesamiento sustancial de entradas visuales provenientes de sensores que consumen mucha energía en representaciones digeribles para los algoritmos informáticos. Esta intensidad computacional acelera el despliegue de sistemas de visión que funcionan continuamente en dispositivos móviles y Internet de las Cosas contextos. En consecuencia, se ha intensificado la búsqueda de arquitecturas bioinspiradas alternativas que equilibren mejor la inteligencia visual con la eficiencia energética. Anteriormente, los investigadores habían luchado por traducir las ventajas clave de la visión biológica en sistemas artificiales. Las cámaras y sensores personalizados a menudo sacrifican la calidad de la imagen y requieren componentes adicionales para codificar las entradas visuales como picos. Mientras tanto, los algoritmos que imitan las neuronas que se activan rara vez igualan la eficiencia de sus homólogos biológicos cuando se ejecutan en hardware informático convencional. Estas limitaciones han paralizado el desarrollo de sistemas de visión artificialmente inteligentes que combinan las capacidades visuales de la visión por computadora de última generación con el bajo consumo de energía de las redes neuronales. Ahora, investigadores de la Universidad Tecnológica de Beijing informan (Materiales avanzados, “Una arquitectura de visión artificial basada en la emulación total de la visión humana”) un prometedor sistema de visión artificial basado en picos que emula facetas clave de la visión biológica en circuitos de silicio. Su novedoso chip de red neuronal fotoactiva convierte la luz directamente en picos de corriente eléctrica mientras exhibe la selectividad de las células de la retina para el cambio visual sobre las entradas estáticas. Utilizando este enfoque bioinspirado que analiza imágenes en vivo, el grupo logró más del 90% de precisión al reconocer los gestos de las manos con una red neuronal elemental después de un entrenamiento marginal. Arquitecturas de visión artificial basadas en copiar y pegar íntegramente la visión humana Arquitecturas de visión artificial basadas en copiar y pegar íntegramente la visión humana. a El sistema visual humano, que consta de la retina (codificación de picos) y el cerebro (procesamiento de información). b La novedosa estrategia de visión artificial basada en picos, que consiste en el fotodetector de picos (codificación de picos) y la sinapsis artificial (procesamiento de información). (Imagen: reimpreso con autorización de Wiley-VCH Verlag) En el centro de esta innovación se encuentran circuitos fotodetectores especializados que generan picos de corriente eléctrica en respuesta a los cambios en los niveles de luz, emulando las células de la retina en el ojo humano. A diferencia de una cámara digital típica que genera un flujo constante de datos de píxeles independientemente del contenido de la imagen, estos 'fotodetectores de picos' permanecen inactivos cuando se ven escenas estáticas, disparando picos sólo para objetos en movimiento o recientemente visibles que necesitan codificación. Este comportamiento selectivo de picos permite una representación eficiente de la información similar a la codificación neuronal de estímulos visuales de la retina humana. En lugar de capturar niveles de luz absolutos en toda una escena, los fotodetectores y sus homólogos biológicos responden predominantemente a los cambios de nivel de luz dentro de su campo receptivo. Los investigadores sugieren que filtrar elementos de la imagen de fondo que no cambian y probablemente no sean importantes permite el reconocimiento excepcional de patrones de visión biológica utilizando recursos neuronales limitados. En las pruebas, la iluminación de conjuntos de estos píxeles controlados por eventos con gráficos simbólicos y gestos con las manos de dinámica variable indujo patrones de picos que contenían información suficiente para la clasificación posterior con un procesamiento simple de redes neuronales. Por ejemplo, convertir la ortografía de los dedos del lenguaje de señas estadounidense en picos permitió una rápida identificación de la red neuronal de cuatro letras distintas utilizando solo 50 muestras de entrenamiento por letra. Significativamente, las técnicas establecidas de aprendizaje profundo solo alcanzaron una precisión comparable después de procesar extensas secuencias de fotogramas de cámaras digitales y unidades de procesamiento de gráficos que consumen mucha más energía. Del mismo modo, al evaluar su sistema en un conjunto de datos estandarizado de actividad humana, los píxeles del fotodetector extrajeron matices adecuados de postura y movimiento de solo cuatro cuadros dispersos de silueta binaria por video. Introducir estas representaciones condensadas de picos de acciones como saltar y saludar en un clasificador de red neuronal básico permitió el reconocimiento con una precisión del 90% después de solo cinco épocas de entrenamiento. Para alcanzar este punto de referencia normalmente es necesario analizar miles de fotografías de vídeo de alta resolución con redes neuronales profundas elaboradamente diseñadas. Para manejar las tareas de reconocimiento de imágenes, el equipo construyó sus circuitos bioinspirados integrando dispositivos sinápticos previamente desarrollados para activar procesadores neuromórficos. Estas sinapsis artificiales imitan la fuerza de conexión ajustable entre las neuronas biológicas, proporcionando una memoria sintonizable para permitir el aprendizaje. Aplicando pulsos de programación, los investigadores ponderaron adecuadamente las sinapsis que recibían picos de los fotodetectores, enseñando a la red a clasificar combinaciones básicas de formas y patrones de movimiento. Las diferencias claras posteriores al entrenamiento en los valores de conductividad de las sinapsis correspondieron a características de identificación únicas dentro de los estímulos ópticos. En general, los resultados muestran avances importantes hacia la computación neuromórfica eficiente utilizando los principios de diseño del cerebro. La representación de información basada en eventos aborda limitaciones clave para implementar inteligencia artificial en plataformas móviles y otros contextos con energía limitada. De cara al futuro, los investigadores pretenden seguir desarrollando su arquitectura de picos para aplicaciones prácticas de visión artificial. Con matrices ampliadas y de mayor resolución para capturar datos visuales más ricos a velocidades de fotogramas que coincidan con la percepción humana, los sistemas de visión inspirados por los biólogos podrían volverse ubicuos. La transmisión de datos optimizada basada en picos desde varios sensores existentes cerraría aún más la brecha con las capacidades biológicas. Para la navegación de vehículos autónomos, las interfaces de realidad aumentada, la robótica y otros ámbitos que se espera impulsen el crecimiento futuro de la demanda de hardware de visión por computadora, las mejoras simultáneas en la capacidad y la eficiencia siguen siendo imperativas.


Michael Berger
By

Michael
Berger



– Michael es autor de tres libros de la Royal Society of Chemistry:
Nano-sociedad: empujando los límites de la tecnología,
Nanotecnología: el futuro es pequeñoy
Nanoingeniería: las habilidades y herramientas que hacen que la tecnología sea invisible
Copyright ©


Nanowerk LLC

¡Conviértete en autor invitado de Spotlight! Únase a nuestro gran y creciente grupo de contribuyentes invitados. ¿Acaba de publicar un artículo científico o tiene otros desarrollos interesantes para compartir con la comunidad de nanotecnología? Aquí se explica cómo publicar en nanowerk.com.

punto_img

Información más reciente

punto_img