Logo Zephyrnet

Bộ tách sóng quang bắt chước võng mạc để cho phép nhận dạng hình ảnh tiết kiệm năng lượng

Ngày:

Ngày 15 tháng 2024 năm XNUMX (Tiêu điểm Nanowerk) Việc bắt chước một cách hiệu quả khả năng thị giác chưa từng có của bộ não con người trong khi hoạt động trong những hạn chế nghiêm ngặt về năng lượng đặt ra một thách thức ghê gớm đối với trí tuệ nhân tạo nhà phát triển. Hệ thống thị giác của con người xử lý dữ liệu quang học một cách tinh tế bằng cách sử dụng các xung điện ngắn gọi là gai, truyền giữa các tế bào thần kinh. Mã thần kinh tăng đột biến này củng cố khả năng nhận dạng mẫu tuyệt vời của chúng tôi bằng cách sử dụng các tài nguyên tính toán hạn chế. Tuy nhiên, thị giác máy hiện đại đòi hỏi phải xử lý đáng kể các đầu vào hình ảnh từ các cảm biến ngốn nhiều năng lượng thành các biểu diễn có thể xử lý được cho các thuật toán máy tính. Cường độ tính toán này hạn chế việc triển khai các hệ thống thị giác hoạt động liên tục trong thiết bị di động và internet vạn vật bối cảnh. Theo đó, việc theo đuổi các kiến ​​trúc lấy cảm hứng từ sinh học thay thế giúp cân bằng tốt hơn trí thông minh thị giác với hiệu quả sử dụng năng lượng đã được tăng cường. Trước đây, các nhà nghiên cứu đã phải vật lộn để chuyển những lợi thế chính của tầm nhìn sinh học sang các hệ thống nhân tạo. Máy ảnh và cảm biến tăng đột biến tùy chỉnh thường hy sinh chất lượng hình ảnh trong khi yêu cầu các thành phần bổ sung để mã hóa đầu vào hình ảnh dưới dạng tăng đột biến. Trong khi đó, các thuật toán mô phỏng các nơ-ron thần kinh chuyển động hiếm khi đạt được hiệu quả như các thuật toán sinh học khi chạy trên phần cứng máy tính thông thường. Những hạn chế này đã cản trở sự phát triển của hệ thống thị giác thông minh nhân tạo kết hợp khả năng thị giác của thị giác máy tính hiện đại với mức tiêu thụ năng lượng thấp của mạng lưới thần kinh tăng đột biến. Bây giờ, các nhà nghiên cứu từ Đại học Công nghệ Bắc Kinh báo cáo (Vật liệu tiên tiến, “Kiến trúc thị giác nhân tạo tăng đột biến dựa trên việc mô phỏng hoàn toàn tầm nhìn của con người”) một hệ thống thị giác nhân tạo dựa trên xung đột đầy hứa hẹn mô phỏng các khía cạnh chính của thị giác sinh học trong các mạch silicon. Chip mạng thần kinh quang hoạt mới của họ chuyển đổi ánh sáng trực tiếp thành các dòng điện đồng thời thể hiện tính chọn lọc của tế bào võng mạc đối với sự thay đổi thị giác đối với đầu vào tĩnh. Bằng cách sử dụng phương pháp lấy cảm hứng sinh học này để phân tích hình ảnh trực tiếp, nhóm đã đạt được độ chính xác trên 90% khi nhận dạng cử chỉ tay bằng mạng lưới thần kinh cơ bản sau quá trình đào tạo cơ bản. Kiến trúc thị giác nhân tạo dựa trên việc sao chép và dán hoàn toàn tầm nhìn của con người Kiến trúc thị giác nhân tạo dựa trên việc sao chép và dán hoàn toàn tầm nhìn của con người. a Hệ thống thị giác của con người, bao gồm võng mạc (mã hóa tăng đột biến) và não (xử lý thông tin). b Chiến lược thị giác nhân tạo dựa trên xung đột mới, bao gồm bộ tách sóng quang tăng đột biến (mã hóa tăng đột biến) và khớp thần kinh nhân tạo (xử lý thông tin). (Hình ảnh: Được in lại với sự cho phép của Wiley-VCH Verlag) Cốt lõi của sự đổi mới này là các mạch tách sóng quang chuyên dụng tạo ra các dòng điện tăng đột biến để đáp ứng với sự thay đổi mức độ ánh sáng, mô phỏng các tế bào võng mạc trong mắt người. Không giống như máy ảnh kỹ thuật số thông thường tạo ra luồng dữ liệu pixel liên tục bất kể nội dung hình ảnh, những 'bộ tách sóng quang tăng vọt' này không hoạt động khi xem cảnh tĩnh, chỉ bắn các xung đối với các đối tượng chuyển động hoặc mới hiển thị cần mã hóa. Hành vi đạp xe có chọn lọc này cho phép biểu diễn thông tin hiệu quả tương tự như mã hóa thần kinh của võng mạc con người về các kích thích thị giác. Thay vì thu được mức ánh sáng tuyệt đối trên toàn bộ khung cảnh, bộ tách sóng quang tăng đột biến và các đối tác sinh học của chúng chủ yếu phản ứng với những thay đổi về mức độ ánh sáng trong trường tiếp nhận của chúng. Các nhà nghiên cứu đề xuất rằng việc lọc ra các yếu tố hình nền không quan trọng và không thay đổi sẽ cho phép nhận dạng mẫu đặc biệt của thị giác sinh học bằng cách sử dụng nguồn tài nguyên thần kinh hạn chế. Trong các thử nghiệm, việc chiếu sáng các mảng pixel hướng sự kiện này bằng đồ họa tượng trưng và cử chỉ tay có động lực khác nhau tạo ra các mẫu tăng đột biến chứa đủ thông tin để phân loại tiếp theo bằng quá trình xử lý mạng thần kinh đơn giản. Ví dụ: việc chuyển đổi cách viết ngón tay trong Ngôn ngữ ký hiệu của Mỹ thành dạng gai cho phép mạng lưới thần kinh nhanh chóng nhận dạng bốn chữ cái riêng biệt chỉ bằng 50 mẫu huấn luyện cho mỗi chữ cái. Điều đáng chú ý là các kỹ thuật học sâu đã được thiết lập chỉ đạt được độ chính xác tương đương sau khi xử lý các chuỗi khung hình mở rộng từ các máy ảnh kỹ thuật số và bộ xử lý đồ họa tiêu tốn nhiều năng lượng hơn. Tương tự như vậy, khi đánh giá hệ thống của họ trên tập dữ liệu hoạt động của con người được tiêu chuẩn hóa, các pixel của bộ tách sóng quang tăng đột biến đã trích xuất các sắc thái tư thế và chuyển động thích hợp chỉ từ bốn khung hình bóng nhị phân thưa thớt trên mỗi video. Việc cung cấp các biểu diễn hành động tăng đột biến cô đọng này như nhảy và vẫy tay vào bộ phân loại mạng thần kinh cơ bản đã cho phép nhận dạng với độ chính xác 90% chỉ sau năm kỷ nguyên đào tạo. Để phù hợp với tiêu chuẩn này thường yêu cầu phân tích hàng nghìn ảnh tĩnh video có độ phân giải cao với mạng lưới thần kinh sâu được thiết kế công phu. Để xử lý các nhiệm vụ nhận dạng hình ảnh, nhóm nghiên cứu đã xây dựng mạch điện lấy cảm hứng từ sinh học bằng cách tích hợp các thiết bị khớp thần kinh được phát triển trước đây để xử lý các bộ xử lý thần kinh. Những khớp thần kinh nhân tạo này mô phỏng cường độ kết nối có thể điều chỉnh giữa các tế bào thần kinh sinh học, cung cấp bộ nhớ có thể điều chỉnh để hỗ trợ việc học tập. Bằng cách áp dụng các xung lập trình, các nhà nghiên cứu đã tính toán các khớp thần kinh có trọng số phù hợp nhận được các đột biến từ bộ tách sóng quang, hướng dẫn mạng phân loại các kết hợp hình dạng cơ bản và mô hình chuyển động. Rõ ràng sự khác biệt sau đào tạo về giá trị độ dẫn của khớp thần kinh tương ứng với các đặc điểm nhận dạng duy nhất trong các kích thích quang học. Nhìn chung, các kết quả cho thấy những bước tiến lớn hướng tới tính toán hình thái thần kinh hiệu quả bằng cách sử dụng các nguyên tắc thiết kế của bộ não. Trình bày thông tin theo hướng sự kiện giải quyết các hạn chế chính trong việc triển khai trí tuệ nhân tạo trên nền tảng di động và các bối cảnh hạn chế về năng lượng khác. Trong tương lai, các nhà nghiên cứu đặt mục tiêu tiếp tục phát triển kiến ​​trúc tăng đột biến của họ cho các ứng dụng thị giác máy thực tế. Với các mảng mở rộng, có độ phân giải cao hơn để thu thập dữ liệu hình ảnh phong phú hơn ở tốc độ khung hình phù hợp với nhận thức của con người, các hệ thống thị giác lấy cảm hứng từ nhà sinh học có thể trở nên phổ biến. Việc truyền dữ liệu dựa trên xung đột biến được tối ưu hóa từ nhiều cảm biến hiện có khác nhau sẽ tiếp tục thu hẹp khoảng cách về năng lực sinh học. Đối với việc điều hướng phương tiện tự động, giao diện thực tế tăng cường, robot và các lĩnh vực khác dự kiến ​​sẽ thúc đẩy tăng trưởng nhu cầu trong tương lai đối với phần cứng thị giác máy tính, việc cải thiện đồng thời khả năng và hiệu quả vẫn là điều bắt buộc.


Michael Berger
By

Michael
Berger



– Michael là tác giả của ba cuốn sách của Hiệp hội Hóa học Hoàng gia:
Xã hội Nano: Đẩy mạnh ranh giới của công nghệ,
Công nghệ nano: Tương lai nhỏ bé
Nanoengineering: Các kỹ năng và công cụ làm cho công nghệ vô hình
Bản quyền ©


Công Ty TNHH Nanowerk

Trở thành tác giả khách mời của Spotlight! Tham gia nhóm lớn và đang phát triển của chúng tôi những người đóng góp cho khách. Bạn vừa xuất bản một bài báo khoa học hoặc có những phát triển thú vị khác để chia sẻ với cộng đồng công nghệ nano? Đây là cách xuất bản trên nanowerk.com.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img