제퍼넷 로고

신경망 시스템의 마음의 눈

시간

17 년 2023 월 XNUMX 일 (나노 워크 뉴스) 소셜 미디어에서 친구를 식별할 수 있는 이미지 인식 소프트웨어와 마당에 핀 야생화의 신원을 확인할 수 있는 이미지 인식 소프트웨어의 배경에는 우리의 두뇌가 데이터를 처리하는 방식에서 영감을 얻은 일종의 인공 지능인 신경망이 있습니다. 신경망이 데이터를 빠르게 처리하는 동안 해당 아키텍처로 인해 컨버스 하이탑과 앵클부츠를 혼동하는 등 인간에게 명백한 오류의 출처를 추적하기 어렵고 의료 이미지 분석이나 연구와 같은 보다 중요한 작업에서의 사용이 제한됩니다. . 퍼듀 대학교(Purdue University)에서 개발된 새로운 도구를 사용하면 비행기에서 산 꼭대기를 찾는 것만큼 간단하게 이러한 오류를 찾을 수 있습니다. "어떤 의미에서 신경망이 말할 수 있다면 우리는 그것이 무엇을 말하려고 하는지를 보여주고 있는 것입니다."라고 이 도구를 개발한 퍼듀 과학 대학 컴퓨터 과학 교수인 David Gleich는 말했습니다. 에 발표된 논문에 실렸습니다. 자연 기계 지능 (“복잡한 예측의 위상적 구조”). “우리가 개발한 도구는 네트워크에서 '요청하신 작업을 수행하려면 더 많은 정보가 필요합니다'라고 말하는 위치를 찾는 데 도움이 됩니다. 나는 사람들에게 위험도가 높은 신경망 결정 시나리오나 이미지 예측 작업에 이 도구를 사용하라고 조언하고 싶습니다.” 코드 이 도구는 GitHub에서 사용할 수 있습니다., 그대로 사용 사례 데모. Gleich는 역시 퍼듀 대학의 컴퓨터 과학 교수인 Tamal K. Dey와 전 퍼듀 대학교 대학원생이자 컴퓨터 과학 박사 학위를 취득한 Meng Liu와 함께 연구에 협력했습니다. 황금 점이 있는 검은색 바탕에 은색 원 신경망의 출력을 확인하는 도구를 사용하면 비행기에서 산 꼭대기를 찾는 것만큼 쉽게 오류를 찾을 수 있습니다. (이미지: 퍼듀 대학교) 접근 방식을 테스트하면서 Gleich 팀은 흉부 엑스레이와 유전자 서열부터 의류에 이르기까지 모든 데이터베이스에서 이미지의 신원을 착각하는 신경망을 발견했습니다. 한 가지 예에서 신경망은 Imagenette 데이터베이스의 자동차 이미지를 카세트 플레이어로 반복적으로 잘못 분류했습니다. 이유? 사진은 온라인 판매 목록에서 가져온 것이며 자동차의 스테레오 장비에 대한 태그가 포함되어 있습니다. 신경망 이미지 인식 시스템은 기본적으로 이미지가 분석되고 식별될 때 뉴런의 가중치 발화 패턴을 모방하는 방식으로 데이터를 처리하는 알고리즘입니다. 시스템은 각 픽셀에 대한 데이터, 태깅 및 기타 정보, 그리고 분류된 이미지의 신원을 포함하는 이미지의 "훈련 세트"를 통해 동물, 의복 또는 종양 식별과 같은 작업에 맞게 훈련됩니다. 특정 카테고리. 훈련 세트를 사용하여 네트워크는 입력 값을 카테고리와 일치시키는 데 필요한 정보를 학습하거나 "추출"합니다. 임베디드 벡터라고 불리는 숫자열인 이 정보는 이미지가 가능한 각 카테고리에 속할 확률을 계산하는 데 사용됩니다. 일반적으로 이미지의 올바른 신원은 확률이 가장 높은 카테고리에 속합니다. 그러나 내장된 벡터와 확률은 인간이 인식하는 의사결정 프로세스와 상관관계가 없습니다. 알려진 데이터를 나타내는 100,000개의 숫자를 입력하면 네트워크는 물리적 특징에 해당하지 않는 128개의 숫자로 구성된 내장 벡터를 생성합니다. 단, 이를 통해 네트워크에서 이미지를 분류할 수 있습니다. 즉, 훈련된 시스템의 알고리즘을 그대로 따라갈 수는 없습니다. 입력 값과 이미지의 예측된 정체성 사이에는 여러 레이어에 걸쳐 인식할 수 없는 숫자로 구성된 "블랙 박스"가 있습니다. "신경망의 문제는 기계 내부를 볼 수 없어 기계가 어떻게 결정을 내리는지 이해할 수 없다는 것입니다. 그렇다면 신경망이 특징적인 실수를 하는지 어떻게 알 수 있을까요?" 글라이치가 말했다. Gleich의 접근 방식은 네트워크를 통해 단일 이미지의 의사 결정 경로를 추적하는 대신 전체 데이터베이스의 모든 이미지 중에서 컴퓨터가 보는 관계를 시각화하는 것이 가능합니다. 신경망이 정리한 모든 이미지를 조감도로 보는 것과 같다고 생각하세요. 이미지 간의 관계(예: 데이터베이스에 있는 각 이미지의 신원 분류에 대한 네트워크의 예측)는 네트워크가 생성하는 내장된 벡터 및 확률을 기반으로 합니다. 뷰의 해상도를 높이고 네트워크가 두 가지 분류를 구별할 수 없는 위치를 찾기 위해 Gleich 팀은 먼저 이미지가 둘 이상의 분류에 속할 확률이 높은 위치를 식별하기 위해 분류를 분할하고 겹치는 방법을 개발했습니다. 그런 다음 팀은 토폴로지 데이터 분석 분야에서 가져온 도구인 Reeb 그래프에 관계를 매핑합니다. 그래프에서 네트워크가 관련되어 있다고 생각하는 각 이미지 그룹은 단일 점으로 표시됩니다. 점은 분류에 따라 색상으로 구분됩니다. 점이 가까울수록 네트워크는 그룹을 더 유사하다고 간주하며, 그래프의 대부분 영역은 단일 색상의 점 클러스터를 표시합니다. 그러나 둘 이상의 분류에 속할 가능성이 높은 이미지 그룹은 두 개의 서로 다른 색상이 겹치는 점으로 표시됩니다. 한눈에 네트워크가 두 가지 분류를 구별할 수 없는 영역은 한 가지 색상의 점 클러스터로 나타나고 두 번째 색상의 겹치는 점들이 흩뿌려집니다. 겹치는 점을 확대하면 자동차와 카세트 플레이어라는 라벨이 붙은 자동차 그림처럼 혼란스러운 영역이 표시됩니다. “우리가 하고 있는 일은 네트워크에서 나오는 이러한 복잡한 정보 세트를 가져와 네트워크가 거시적 수준에서 데이터를 보는 방식에 대한 '정보'를 사람들에게 제공하는 것입니다."라고 Gleich는 말했습니다.
spot_img

최신 인텔리전스

spot_img