제퍼넷 로고

아날로그 컴퓨팅의 확장성 한계 극복

시간

기계 학습 모델이 더 커지고 복잡해짐에 따라 계산을 수행하려면 더 빠르고 에너지 효율적인 하드웨어가 필요합니다. 기존의 디지털 컴퓨터는 따라잡기 위해 고군분투하고 있습니다.

아날로그 광 신경망은 이미지 분류나 음성 인식 등 디지털과 동일한 작업을 수행할 수 있지만 전기 신호 대신 빛을 사용하여 계산을 수행하기 때문에 광 신경망은 더 적은 에너지를 사용하면서 몇 배 더 빠르게 실행할 수 있습니다.

그러나 이러한 아날로그 장치는 계산 정확도를 떨어뜨리는 하드웨어 오류가 발생하기 쉽습니다. 하드웨어 구성 요소의 미세한 결함이 이러한 오류의 원인 중 하나입니다. 연결된 구성 요소가 많은 광학 신경망에서는 오류가 빠르게 누적될 수 있습니다.

오류 수정 기술을 사용하더라도 광학 신경망을 구성하는 장치의 기본 특성으로 인해 어느 정도의 오류는 피할 수 없습니다. 실제 세계에서 구현하기에 충분히 큰 네트워크는 너무 정확하지 않아 효과적이지 않습니다.

MIT 연구원들은 이 장애물을 극복하고 광학 신경망을 효과적으로 확장하는 방법을 찾았습니다. 네트워크 아키텍처를 구성하는 광 스위치에 작은 하드웨어 구성 요소를 추가하면 장치에 누적되는 수정할 수 없는 오류도 줄일 수 있습니다.

그들의 작업은 디지털 신경망과 동일한 정확도로 기능할 수 있는 초고속, 에너지 효율적인 아날로그 신경망을 가능하게 할 수 있습니다. 이 기술을 사용하면 광학 회로가 커질수록 계산 오류의 양이 실제로 감소합니다.  

"회로가 클수록 더 높은 오류가 발생하여 오류가 확장성에 제한을 두는 아날로그 시스템의 직관에 반하기 때문에 이것은 놀라운 일입니다. 이 논문을 통해 우리는 이러한 시스템의 확장성 문제를 명확하게 '예'라고 대답할 수 있습니다. .

Hamerly의 공동 저자는 대학원생 Saumil Bandyopadhyay와 MIT 전기 공학 및 컴퓨터 과학(EECS) 부교수이자 양자 광자 연구소의 리더이자 RLE의 회원인 수석 저자 Dirk Englund입니다. 이 연구는 오늘 자연 통신.

빛으로 곱하기

광학 신경망은 재프로그래밍 및 조정 가능한 거울처럼 기능하는 연결된 여러 구성 요소로 구성됩니다. 이러한 조정 가능한 거울을 MZI(Mach-Zehnder Inferometer)라고 합니다. 신경망 데이터는 레이저에서 광학 신경망으로 발사되는 빛으로 인코딩됩니다.

일반적인 MZI에는 XNUMX개의 미러와 XNUMX개의 빔 스플리터가 포함되어 있습니다. 빛은 MZI의 상단으로 들어가 두 번째 빔 스플리터에 의해 재결합되기 전에 서로 간섭하는 두 부분으로 분할된 다음 배열의 다음 MZI로 하단에서 반사됩니다. 연구자들은 이러한 광학 신호의 간섭을 활용하여 신경망이 데이터를 처리하는 방식인 행렬 곱셈으로 알려진 복잡한 선형 대수 연산을 수행할 수 있습니다.

그러나 각 MZI에서 발생할 수 있는 오류는 빛이 한 장치에서 다음 장치로 이동함에 따라 빠르게 누적됩니다. 사전에 오류를 식별하고 MZI를 조정하여 일부 오류를 방지할 수 있으므로 이전 오류는 어레이의 이후 장치에 의해 취소됩니다.

“오류가 무엇인지 안다면 매우 간단한 알고리즘입니다. 그러나 이러한 오류는 칩의 입력 및 출력에만 액세스할 수 있기 때문에 확인하기 매우 어렵습니다.”라고 Hamerly는 말합니다. "이로 인해 교정이 필요 없는 오류 수정이 가능한지 여부를 확인하게 되었습니다."

Hamerly와 그의 협력자들은 이전에 수학적 기법을 보여주었다 한 단계 더 나아간 것입니다. 오류를 성공적으로 추론하고 그에 따라 MZI를 올바르게 조정할 수 있었지만 이것으로도 모든 오류가 제거되지는 않았습니다.

MZI의 기본 특성으로 인해 모든 빛이 하단 포트에서 다음 MZI로 흐르도록 장치를 조정하는 것이 불가능한 경우가 있습니다. 장치가 각 단계에서 빛의 일부를 잃고 어레이가 매우 큰 경우 결국에는 약간의 전력만 남게 됩니다.

“오류 수정이 있더라도 칩의 성능에는 근본적인 한계가 있습니다. MZI는 구성해야 하는 특정 설정을 물리적으로 인식할 수 없습니다.”라고 그는 말합니다.

그래서 팀은 새로운 유형의 MZI를 개발했습니다. 연구원들은 장치 끝에 추가 빔 스플리터를 추가하여 3개가 아닌 XNUMX개의 빔 스플리터를 가지고 있기 때문에 XNUMX-MZI라고 부릅니다. 이 추가 빔 스플리터가 빛을 혼합하는 방식으로 인해 MZI가 하단 포트를 통해 모든 빛을 보내는 데 필요한 설정에 도달하는 것이 훨씬 쉬워집니다.

중요한 것은 추가 빔 스플리터의 크기가 수 마이크로미터에 불과하고 수동 부품이므로 추가 배선이 필요하지 않다는 것입니다. 추가 빔 스플리터를 추가해도 칩 크기가 크게 변경되지는 않습니다.

더 큰 칩, 더 적은 오류

연구원들이 아키텍처를 테스트하기 위해 시뮬레이션을 수행했을 때 정확성을 저해하는 수정할 수 없는 오류를 많이 제거할 수 있음을 발견했습니다. 그리고 광학 신경망이 커짐에 따라 장치의 오류 양이 실제로 감소합니다. 이는 표준 MZI가 있는 장치에서 발생하는 것과 반대입니다.

3-MZI를 사용하면 오류가 20분의 XNUMX로 줄어든 상업적 용도로 충분히 큰 장치를 잠재적으로 만들 수 있다고 Hamerly는 말합니다.

연구원들은 또한 상관 오류를 위해 특별히 MZI 디자인의 변형을 개발했습니다. 이는 제조상의 결함으로 인해 발생합니다. 칩의 두께가 약간 잘못된 경우 MZI가 모두 거의 같은 양만큼 떨어져 있을 수 있으므로 오류는 모두 거의 같습니다. 그들은 이러한 유형의 오류에 대해 견고하게 만들기 위해 MZI의 구성을 변경하는 방법을 찾았습니다. 이 기술은 또한 광 신경망의 대역폭을 증가시켜 XNUMX배 더 빠르게 실행할 수 있습니다.

시뮬레이션을 사용하여 이러한 기술을 선보였으므로 Hamerly와 그의 공동 작업자는 물리적 하드웨어에서 이러한 접근 방식을 테스트하고 실제 세계에 효과적으로 배포할 수 있는 광학 신경망을 향해 계속 추진할 계획입니다.

이 연구는 부분적으로 국립 과학 재단 대학원 연구 펠로우쉽과 미 공군 과학 연구실에서 자금을 지원 받았습니다.

<!–
–>

spot_img

최신 인텔리전스

spot_img