شعار زيفيرنت

تحاكي أجهزة الكشف الضوئي المتصاعدة شبكية العين لتمكين التعرف البصري الموفر للطاقة

التاريخ:

15 فبراير 2024 (أضواء Nanowerk) إن المحاكاة الفعالة للقدرات البصرية التي لا مثيل لها للدماغ البشري أثناء العمل ضمن قيود الطاقة الصارمة تشكل تحديًا هائلاً لـ الذكاء الاصطناعي المطورين. يقوم الجهاز البصري البشري بمعالجة البيانات البصرية بأناقة باستخدام نبضات كهربائية قصيرة تسمى المسامير، تنتقل بين الخلايا العصبية. تدعم هذه الشفرة العصبية المتصاعدة التعرف على الأنماط التي لا مثيل لها باستخدام موارد حسابية محدودة. ومع ذلك، تتطلب الرؤية الآلية المعاصرة معالجة كبيرة للمدخلات المرئية من أجهزة الاستشعار المتعطشة للطاقة إلى تمثيلات قابلة للهضم لخوارزميات الكمبيوتر. تعمل هذه الكثافة الحسابية على خنق نشر أنظمة الرؤية التي تعمل بشكل مستمر في الأجهزة المحمولة و انترنت الأشياء السياقات. وبناءً على ذلك، تم تكثيف السعي وراء تصميمات بديلة مستوحاة من الحيوية تحقق توازنًا أفضل بين الذكاء البصري وكفاءة الطاقة. في السابق، ناضل الباحثون من أجل ترجمة المزايا الرئيسية للرؤية البيولوجية إلى أنظمة صناعية. غالبًا ما تضحي الكاميرات وأجهزة الاستشعار المخصصة ذات المسامير بجودة الصورة بينما تتطلب مكونات إضافية لتشفير المدخلات المرئية على شكل مسامير. وفي الوقت نفسه، نادرًا ما تتطابق الخوارزميات التي تحاكي الخلايا العصبية المتصاعدة مع كفاءة نظيراتها البيولوجية عند تشغيلها على أجهزة الكمبيوتر التقليدية. وقد أعاقت هذه القيود تطوير أنظمة الرؤية ذات الذكاء الاصطناعي التي تجمع بين القدرات البصرية لرؤية الكمبيوتر الحديثة مع انخفاض استهلاك الطاقة للشبكات العصبية المتصاعدة. الآن، تقرير باحثون من جامعة بكين للتكنولوجيا (المواد المتقدمة, "هندسة رؤية اصطناعية متصاعدة تعتمد على محاكاة الرؤية البشرية بشكل كامل") نظام رؤية اصطناعية واعد قائم على الشائكة يحاكي الجوانب الرئيسية للرؤية البيولوجية في دوائر السيليكون. تعمل شريحة الشبكة العصبية الضوئية الجديدة الخاصة بهم على تحويل الضوء مباشرة إلى طفرات من التيار الكهربائي مع إظهار انتقائية خلايا الشبكية للتغيير البصري عبر المدخلات الثابتة. باستخدام هذا النهج المستوحى بيولوجيًا لتحليل الصور الحية، حققت المجموعة دقة تزيد عن 90% في التعرف على إيماءات اليد باستخدام شبكة عصبية أولية بعد تدريب هامشي. هياكل الرؤية الاصطناعية تعتمد على النسخ واللصق الكامل للرؤية البشرية هياكل الرؤية الاصطناعية تعتمد على النسخ واللصق الكامل للرؤية البشرية. a الجهاز البصري البشري، ويتكون من شبكية العين (التشفير المتصاعد) والدماغ (معالجة المعلومات). b استراتيجية الرؤية الاصطناعية الجديدة القائمة على الشائكة، والتي تتكون من الكاشف الضوئي الشائك (تشفير الشائك) والمشبك الاصطناعي (معالجة المعلومات). (الصورة: أعيد طبعها بإذن من Wiley-VCH Verlag) في قلب هذا الابتكار تكمن دوائر كاشف ضوئي متخصصة تنتج طفرات من التيار الكهربائي استجابة لتغير مستويات الضوء، ومحاكاة خلايا الشبكية في العين البشرية. على عكس الكاميرا الرقمية النموذجية التي تنتج دفقًا مستمرًا من بيانات البكسل بغض النظر عن محتوى الصورة، تظل "أجهزة الكشف الضوئي المتصاعدة" هذه غير نشطة عند عرض المشاهد الثابتة، ولا تطلق المسامير إلا للأجسام المتحركة أو المرئية حديثًا التي تحتاج إلى تشفير. يتيح هذا السلوك المتصاعد الانتقائي تمثيل معلومات فعالًا مشابهًا للتشفير العصبي للمحفزات البصرية في شبكية العين البشرية. بدلاً من التقاط مستويات الضوء المطلقة عبر المشهد بأكمله، تستجيب أجهزة الكشف الضوئي المتصاعدة ونظيراتها البيولوجية في الغالب للتغيرات في مستوى الضوء داخل مجالها الاستقبالي. يقترح الباحثون أن تصفية عناصر الصورة الخلفية غير المتغيرة والتي من المحتمل أن تكون غير مهمة تمكن من التعرف على الأنماط الاستثنائية للرؤية البيولوجية باستخدام موارد عصبية محدودة. في الاختبارات، أدت تسليط الضوء على مصفوفات من هذه البكسلات المدفوعة بالحدث باستخدام رسومات رمزية وإيماءات يدوية ذات ديناميكيات مختلفة إلى إحداث أنماط حادة تحتوي على معلومات كافية للتصنيف اللاحق من خلال معالجة بسيطة للشبكة العصبية. على سبيل المثال، أدى تحويل تهجئة الأصابع بلغة الإشارة الأمريكية إلى طفرات إلى السماح بالتعرف السريع على الشبكة العصبية لأربعة أحرف مميزة باستخدام 50 عينة تدريب فقط لكل حرف. ومن الجدير بالذكر أن تقنيات التعلم العميق الراسخة لم تحقق دقة قابلة للمقارنة إلا بعد معالجة تسلسلات إطارات واسعة النطاق من الكاميرات الرقمية ووحدات معالجة الرسومات الأكثر استهلاكًا للطاقة. وبالمثل، عند تقييم نظامهم على مجموعة بيانات موحدة للنشاط البشري، استخرجت وحدات البكسل الكاشفة للضوء الفروق الدقيقة في الوضعية والحركة من أربعة إطارات صورة ظلية ثنائية متفرقة فقط لكل فيديو. إن تغذية هذه التمثيلات المكثفة لحركات مثل القفز والتلويح في مصنف شبكة عصبية أساسي، أتاح التعرف بدقة تصل إلى 90% بعد خمس فترات تدريب فقط. تتطلب مطابقة هذا المعيار عادةً تحليل الآلاف من لقطات الفيديو عالية الدقة باستخدام شبكات عصبية عميقة مصممة بشكل متقن. للتعامل مع مهام التعرف على الصور، قام الفريق ببناء دوائرهم المستوحاة من الحياة من خلال دمج الأجهزة المتشابكة التي تم تطويرها سابقًا للمعالجات العصبية المتصاعدة. تحاكي هذه المشابك العصبية الاصطناعية قوة الاتصال القابلة للتعديل بين الخلايا العصبية البيولوجية، مما يوفر ذاكرة قابلة للضبط لتمكين التعلم. ومن خلال تطبيق نبضات برمجة، قام الباحثون بوزن المشابك العصبية التي تستقبل نبضات من أجهزة الكشف الضوئي بشكل مناسب، وتعليم الشبكة كيفية تصنيف مجموعات أنماط الشكل والحركة الأساسية. تتوافق الاختلافات الواضحة بعد التدريب في قيم الموصلية المشبكية مع ميزات التعريف الفريدة داخل المحفزات البصرية. بشكل عام، تُظهر النتائج خطوات كبيرة نحو الحوسبة العصبية الفعالة باستخدام مبادئ تصميم الدماغ. يعالج تمثيل المعلومات المستند إلى الأحداث القيود الرئيسية لنشر الذكاء الاصطناعي على منصات الهاتف المحمول وغيرها من السياقات محدودة الطاقة. وبالتطلع إلى المستقبل، يهدف الباحثون إلى مواصلة تطوير بنيتهم ​​المتصاعدة لتطبيقات الرؤية الآلية العملية. ومع وجود مصفوفات موسعة وعالية الدقة لالتقاط بيانات مرئية أكثر ثراءً بمعدلات إطارات تتوافق مع الإدراك البشري، يمكن أن تصبح أنظمة الرؤية المستوحاة من علماء الأحياء منتشرة في كل مكان. إن نقل البيانات على أساس الارتفاع الأمثل من مختلف أجهزة الاستشعار الموجودة من شأنه أن يزيد من سد الفجوة مع القدرات البيولوجية. بالنسبة للملاحة في المركبات ذاتية القيادة، وواجهات الواقع المعزز، والروبوتات، والمجالات الأخرى التي من المتوقع أن تدفع نمو الطلب المستقبلي على أجهزة الرؤية الحاسوبية، تظل التحسينات المتزامنة للقدرة والكفاءة أمرًا ضروريًا.


مايكل بيرجر
By

مايكل
بيرجر



- مايكل مؤلف لثلاثة كتب للجمعية الملكية للكيمياء:
جمعية النانو: دفع حدود التكنولوجيا,
تقنية النانو: المستقبل صغيرو
هندسة النانو: المهارات والأدوات التي تجعل التكنولوجيا غير مرئية
حقوق الطبع والنشر ©


نانويرك ذ

كن مؤلفًا ضيفًا في Spotlight! انضم إلى مجموعتنا الكبيرة والمتنامية من المساهمين الضيوف. هل نشرت للتو ورقة علمية أو لديك تطورات أخرى مثيرة لمشاركتها مع مجتمع تكنولوجيا النانو؟ إليك كيفية النشر على nanowerk.com.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة