Zephyrnet-logo

Spiking-fotodetectoren bootsen het netvlies na om energiezuinige visuele herkenning mogelijk te maken

Datum:

15 februari 2024 (Nanowerk-schijnwerper) Het effectief nabootsen van de ongeëvenaarde visuele capaciteiten van het menselijk brein, terwijl het werkt binnen strenge energiebeperkingen, vormt een enorme uitdaging voor kunstmatige intelligentie ontwikkelaars. Het menselijke visuele systeem verwerkt op elegante wijze optische gegevens met behulp van korte elektrische pulsen, pieken genoemd, die tussen neuronen worden overgedragen. Deze enorme neurale code ondersteunt onze ongeëvenaarde patroonherkenning met behulp van beperkte computerbronnen. De hedendaagse machinevisie brengt echter een substantiële verwerking van visuele input van energievretende sensoren met zich mee in representaties die verteerbaar zijn voor computeralgoritmen. Deze rekenintensiteit remt de inzet van continu werkende vision-systemen in mobiele en internet van dingen contexten. Het streven naar alternatieve bio-geïnspireerde architecturen die visuele intelligentie beter in balans brengen met energie-efficiëntie is dienovereenkomstig geïntensiveerd. Eerder hadden onderzoekers moeite om de belangrijkste voordelen van biologisch zicht te vertalen naar kunstmatige systemen. Aangepaste piekcamera's en -sensoren offeren vaak de beeldkwaliteit op, terwijl er extra componenten nodig zijn om visuele input als pieken te coderen. Ondertussen komen algoritmen die stekelige neuronen nabootsen zelden overeen met de efficiëntie van hun biologische tegenhangers wanneer ze op conventionele computerhardware draaien. Deze beperkingen hebben de ontwikkeling van kunstmatig intelligente visiesystemen tot stilstand gebracht die de visuele mogelijkheden van de modernste computervisie combineren met het lage energieverbruik van krachtige neurale netwerken. Nu rapporteren onderzoekers van de Beijing University of Technology (Geavanceerde materialen, “Een verbluffende architectuur voor kunstmatige visie, gebaseerd op het volledig emuleren van de menselijke visie”) een veelbelovend op spiking gebaseerd kunstmatig zichtsysteem dat de belangrijkste facetten van biologisch zicht in siliciumcircuits emuleert. Hun nieuwe fotoactieve neurale netwerkchip zet licht direct om in elektrische stroompieken en vertoont tegelijkertijd de selectiviteit van netvliescellen voor visuele verandering ten opzichte van statische input. Met behulp van deze bio-geïnspireerde aanpak waarbij live beelden werden geanalyseerd, bereikte de groep na marginale training een nauwkeurigheid van meer dan 90% door handgebaren te herkennen met een elementair neuraal netwerk. Kunstmatige visie-architecturen gebaseerd op het volledig kopiëren en plakken van de menselijke visie Kunstmatige visie-architecturen gebaseerd op het volledig kopiëren en plakken van de menselijke visie. a Het menselijke visuele systeem, bestaande uit het netvlies (spiking-codering) en de hersenen (informatieverwerking). b De nieuwe op spiking gebaseerde kunstmatige visiestrategie, bestaande uit de spiking-fotodetector (spiking-codering) en de kunstmatige synaps (informatieverwerking). (Afbeelding: herdrukt met toestemming van Wiley-VCH Verlag) De kern van deze innovatie ligt in gespecialiseerde fotodetectorcircuits die elektrische stroompieken produceren als reactie op veranderende lichtniveaus, waarbij netvliescellen in het menselijk oog worden nagebootst. In tegenstelling tot een typische digitale camera die een constante stroom pixelgegevens uitvoert, ongeacht de beeldinhoud, blijven deze 'spiking-fotodetectoren' inactief bij het bekijken van statische scènes, waarbij ze alleen pieken afvuren voor bewegende of nieuw zichtbare objecten die codering nodig hebben. Dit selectieve piekgedrag maakt een efficiënte informatierepresentatie mogelijk, vergelijkbaar met de neurale codering van visuele stimuli door het menselijk netvlies. In plaats van absolute lichtniveaus over een hele scène vast te leggen, reageren de piekfotodetectoren en hun biologische tegenhangers voornamelijk op veranderingen in het lichtniveau binnen hun receptieve veld. De onderzoekers suggereren dat het uitfilteren van onveranderlijke en waarschijnlijk onbelangrijke achtergrondbeeldelementen de uitzonderlijke patroonherkenning van biologisch zicht mogelijk maakt met behulp van beperkte neurale bronnen. In tests veroorzaakte het verlichten van reeksen van deze gebeurtenisgestuurde pixels met symbolische afbeeldingen en handgebaren met verschillende dynamiek piekpatronen die voldoende informatie bevatten voor daaropvolgende classificatie met eenvoudige neurale netwerkverwerking. Het omzetten van vingerspellingen in Amerikaanse gebarentaal in pieken maakte bijvoorbeeld een snelle neurale netwerkidentificatie van vier verschillende letters mogelijk met behulp van slechts 50 trainingsvoorbeelden per letter. Het is veelbetekenend dat gevestigde deep learning-technieken pas een vergelijkbare nauwkeurigheid bereikten na het verwerken van uitgebreide framereeksen van veel energieverslindende digitale camera's en grafische verwerkingseenheden. Op dezelfde manier haalden de piekende fotodetectorpixels bij het evalueren van hun systeem op basis van een gestandaardiseerde dataset van menselijke activiteiten adequate houdings- en bewegingsnuances uit slechts vier spaarzame binaire silhouetframes per video. Door deze gecondenseerde piekrepresentaties van acties zoals springen en zwaaien in een fundamentele neurale netwerkclassificator te plaatsen, werd herkenning met 90% nauwkeurigheid mogelijk na slechts vijf trainingsperioden. Om aan deze benchmark te voldoen, is doorgaans het analyseren van duizenden videobeelden met hoge resolutie nodig met uitvoerig ontworpen diepe neurale netwerken. Om beeldherkenningstaken uit te voeren, bouwde het team hun bio-geïnspireerde circuits uit door synaptische apparaten te integreren die eerder waren ontwikkeld voor het versterken van neuromorfe processors. Deze kunstmatige synapsen bootsen de aanpasbare verbindingssterkte tussen biologische neuronen na en zorgen voor een afstembaar geheugen om leren mogelijk te maken. Door programmeerpulsen toe te passen, wogen de onderzoekers synapsen op de juiste manier en ontvingen ze pieken van de fotodetectoren, waardoor het netwerk werd geleerd basisvorm- en bewegingspatrooncombinaties te classificeren. Duidelijke verschillen na de training in de geleidbaarheidswaarden van de synaps kwamen overeen met unieke identificerende kenmerken binnen optische stimuli. Over het geheel genomen laten de resultaten grote stappen zien in de richting van efficiënt neuromorfisch computergebruik, waarbij gebruik wordt gemaakt van de ontwerpprincipes van de hersenen. Gebeurtenisgestuurde informatierepresentatie pakt de belangrijkste beperkingen aan voor de inzet van kunstmatige intelligentie op mobiele platforms en andere machtsbeperkte contexten. Vooruitkijkend willen de onderzoekers hun spiking-architectuur blijven ontwikkelen voor praktische machine vision-toepassingen. Met uitgebreide arrays met hogere resolutie voor het vastleggen van rijkere visuele gegevens met framesnelheden die overeenkomen met de menselijke perceptie, zouden door biologen geïnspireerde zichtsystemen alomtegenwoordig kunnen worden. Geoptimaliseerde, op pieken gebaseerde datatransmissie van verschillende bestaande sensoren zou de kloof met biologische capaciteiten verder dichten. Voor autonome voertuignavigatie, augmented reality-interfaces, robotica en andere domeinen die naar verwachting de toekomstige groei van de vraag naar computer vision-hardware zullen stimuleren, blijven gelijktijdige verbeteringen van de mogelijkheden en efficiëntie absoluut noodzakelijk.


Michael Berger
By

Michael
Berger



– Michael is auteur van drie boeken van de Royal Society of Chemistry:
Nano-Society: de grenzen van technologie verleggen,
Nanotechnologie: de toekomst is klein en
Nanoengineering: de vaardigheden en tools die technologie onzichtbaar maken
Copyright ©


Nanowerk LLC

Word een Spotlight-gastauteur! Sluit je aan bij onze grote en groeiende groep gastbijdragers. Heb je net een wetenschappelijk artikel gepubliceerd of heb je andere opwindende ontwikkelingen om te delen met de nanotechnologie-gemeenschap? Hier leest u hoe u op nanowerk.com publiceert.

spot_img

Laatste intelligentie

spot_img