Zephyrnet Logosu

Çivili fotodetektörler, enerji tasarruflu görsel tanımayı sağlamak için retinayı taklit eder

Tarih:

15 Şubat 2024 (Nanowerk Gündemi) Sıkı enerji kısıtlamaları altında çalışırken insan beyninin eşsiz görsel kapasitelerini etkili bir şekilde taklit etmek, büyük bir zorluk teşkil etmektedir. yapay zeka geliştiriciler. İnsanın görsel sistemi, nöronlar arasında iletilen ve sivri uçlar olarak adlandırılan kısa elektrik darbelerini kullanarak optik verileri zarif bir şekilde işler. Bu artan sinir kodu, sınırlı hesaplama kaynaklarını kullanan benzersiz örüntü tanıma yeteneğimizi desteklemektedir. Bununla birlikte, çağdaş yapay görme, güce aç sensörlerden gelen görsel girdilerin bilgisayar algoritmaları için sindirilebilir temsillere önemli ölçüde işlenmesini gerektirir. Bu hesaplama yoğunluğu, sürekli çalışan görüş sistemlerinin mobil ve nesnelerin interneti bağlamlar. Görsel zekayı enerji verimliliğiyle daha iyi dengeleyen, biyo-esinli alternatif mimarilerin arayışı da buna bağlı olarak yoğunlaştı. Daha önce araştırmacılar biyolojik görmenin temel avantajlarını yapay sistemlere dönüştürmekte zorlanıyordu. Özel sivri kameralar ve sensörler, görsel girdileri ani artışlar olarak kodlamak için ekstra bileşenler gerektirirken sıklıkla görüntü kalitesinden ödün verir. Bu arada, artan nöronları taklit eden algoritmalar, geleneksel bilgisayar donanımı üzerinde çalışırken biyolojik muadillerinin verimliliğiyle nadiren eşleşiyor. Bu sınırlamalar, en son teknolojiye sahip bilgisayarlı görmenin görsel yeteneklerini, artan sinir ağlarının düşük enerji tüketimiyle birleştiren yapay zekalı görme sistemlerinin gelişimini durdurdu. Şimdi, Pekin Teknoloji Üniversitesi'nden araştırmacılar rapor ediyor (Gelişmiş malzemeler, “İnsan Görüşünü Tamamen Taklit Etmeye Dayalı, Yükselen Bir Yapay Görme Mimarisi”) silikon devrelerde biyolojik görüşün temel yönlerini taklit eden umut verici bir sivri uçlu yapay görme sistemi. Yeni fotoaktif sinir ağı çipleri, ışığı doğrudan elektrik akımının sivri uçlarına dönüştürürken, retina hücrelerinin statik girdilere göre görsel değişime yönelik seçiciliğini sergiliyor. Grup, canlı görüntüleri analiz eden bu biyolojik ilhamlı yaklaşımı kullanarak, marjinal eğitimden sonra temel bir sinir ağıyla el hareketlerini tanımada %90'ın üzerinde doğruluk elde etti. İnsan görüşünün tamamen kopyalanıp yapıştırılmasına dayalı yapay görüş mimarileri İnsan görüşünün tamamen kopyalanıp yapıştırılmasına dayanan yapay görüş mimarileri. a Retina (sivri kodlama) ve beyinden (bilgi işleme) oluşan insan görsel sistemi. b Spiker fotodetektör (spiking kodlaması) ve yapay sinapstan (bilgi işleme) oluşan yeni spike tabanlı yapay görme stratejisi. (Resim: Wiley-VCH Verlag'ın izniyle yeniden basılmıştır) Bu yeniliğin temelinde, insan gözündeki retina hücrelerini taklit ederek değişen ışık seviyelerine yanıt olarak elektrik akımı artışları üreten özel fotodedektör devreleri yatıyor. Görüntü içeriğinden bağımsız olarak sabit bir piksel verisi akışı çıkaran tipik bir dijital kameranın aksine, bu "sivri uçlu fotodetektörler" statik sahneleri görüntülerken devre dışı kalır ve yalnızca kodlama gerektiren hareketli veya yeni görülebilen nesneler için sivri uçları ateşler. Bu seçici artış davranışı, insan retinasının görsel uyaranları sinirsel kodlamasına benzer şekilde verimli bilgi temsiline olanak tanır. Yükselen fotodedektörler ve biyolojik muadilleri, tüm sahne boyunca mutlak ışık seviyelerini yakalamak yerine, ağırlıklı olarak alıcı alanlarındaki ışık seviyesi değişikliklerine yanıt veriyor. Araştırmacılar, değişmeyen ve muhtemelen önemsiz arka plan görüntü öğelerinin filtrelenmesinin, sınırlı sinir kaynaklarını kullanarak biyolojik görmenin olağanüstü model tanımasını mümkün kıldığını öne sürüyor. Testlerde, olaya dayalı bu piksellerden oluşan dizilerin sembolik grafiklerle ve değişen dinamiklere sahip el hareketleriyle aydınlatılması, basit sinir ağı işlemeyle sonraki sınıflandırma için yeterli bilgi içeren sivri uçlu desenleri tetikledi. Örneğin, Amerikan İşaret Dili parmak yazımlarını sivri uçlara dönüştürmek, harf başına yalnızca 50 eğitim örneği kullanarak dört farklı harfin hızlı sinir ağı tanımlamasına olanak sağladı. Belirgin bir şekilde, yerleşik derin öğrenme teknikleri ancak çok daha fazla güce aç dijital kameralardan ve grafik işleme birimlerinden gelen kapsamlı kare dizilerini işledikten sonra karşılaştırılabilir bir doğruluk elde etti. Benzer şekilde, sistemlerini standartlaştırılmış bir insan etkinliği veri kümesi üzerinde değerlendirirken, yükselen fotodedektör pikselleri, video başına yalnızca dört seyrek ikili siluet karesinden yeterli duruş ve hareket nüanslarını çıkardı. Atlama ve el sallama gibi eylemlerin bu yoğunlaştırılmış ani temsillerinin temel bir sinir ağı sınıflandırıcısına beslenmesi, yalnızca beş eğitim döneminden sonra %90 doğrulukla tanımayı mümkün kıldı. Bu kriterin karşılanması genellikle binlerce yüksek çözünürlüklü video görüntüsünün özenle tasarlanmış derin sinir ağlarıyla analiz edilmesini gerektirir. Görüntü tanıma görevlerini yerine getirmek için ekip, daha önce nöromorfik işlemcileri hızlandırmak için geliştirilmiş sinaptik cihazları entegre ederek biyo-ilhamlı devrelerini oluşturdu. Bu yapay sinapslar, biyolojik nöronlar arasındaki ayarlanabilir bağlantı gücünü taklit ederek öğrenmeyi mümkün kılmak için ayarlanabilir hafıza sağlar. Programlama darbeleri uygulayan araştırmacılar, fotodetektörlerden sivri uçlar alan sinapsları uygun şekilde ağırlıklandırdılar ve ağa temel şekil ve hareket modeli kombinasyonlarını sınıflandırmayı öğrettiler. Sinaps iletkenlik değerlerindeki eğitim sonrası net farklılıklar, optik uyaranlardaki benzersiz tanımlayıcı özelliklere karşılık geldi. Genel olarak sonuçlar, beynin tasarım ilkelerini kullanan etkili nöromorfik hesaplamaya yönelik büyük adımları ortaya koyuyor. Olay odaklı bilgi gösterimi, yapay zekanın mobil platformlarda ve gücün sınırlı olduğu diğer bağlamlarda kullanılmasına yönelik temel kısıtlamaları ele alır. İleriye dönük olarak araştırmacılar, pratik makine görüşü uygulamaları için öne çıkan mimarilerini geliştirmeye devam etmeyi hedefliyorlar. İnsan algısına uygun kare hızlarında daha zengin görsel veriler yakalamak için genişletilmiş, daha yüksek çözünürlüklü dizilerle, biyologlardan ilham alan görme sistemleri her yerde bulunabilir. Mevcut çeşitli sensörlerden optimize edilmiş spike tabanlı veri iletimi, biyolojik kapasitelerle aradaki açığı daha da kapatacaktır. Otonom araç navigasyonu, artırılmış gerçeklik arayüzleri, robot teknolojisi ve bilgisayarlı görüş donanımına yönelik gelecekte talep artışına yol açması beklenen diğer alanlar için, yetenek ve verimlilikte eş zamanlı iyileştirmeler zorunlu olmaya devam ediyor.


Michael Berger
By

Michael
Berger



– Michael, Royal Society of Chemistry tarafından yazılan üç kitabın yazarıdır:
Nano-Toplum: Teknolojinin Sınırlarını Zorlamak,
Nanoteknoloji: Gelecek Küçük, ve
Nano-mühendislik: Teknolojiyi Görünmez Yapan Beceri ve Araçlar
Telif Hakkı ©


Nanowerk LLC

Spotlight konuk yazarı olun! Geniş ve büyüyen grubumuza katılın konuk katkıda bulunanlar. Nanoteknoloji topluluğuyla paylaşmak için bilimsel bir makale yayınladınız mı veya başka heyecan verici gelişmeleriniz mi var? Nanowerk.com'da nasıl yayınlayacağınız burada.

spot_img

En Son İstihbarat

spot_img