제퍼넷 로고

스파스 신경망은 물리학자를 유용한 데이터로 안내 | 콴타 매거진

시간

개요

천 페이지의 책이 있지만 각 페이지에는 한 줄의 텍스트만 있다고 가정합니다. 스캐너를 사용하여 책에 포함된 정보를 추출해야 합니다. 이 특정 스캐너만이 한 번에 XNUMX제곱인치를 스캔하면서 모든 페이지를 체계적으로 검사합니다. 그 스캐너로 책 전체를 읽는 데 오랜 시간이 걸리고 대부분의 시간은 빈 공간을 스캔하는 데 낭비됩니다. 

이것이 많은 실험 물리학자의 삶입니다. 입자 실험에서 검출기는 방대한 양의 데이터를 캡처하고 분석합니다. 유용한 정보가 포함된 데이터는 극히 일부에 불과합니다. "예를 들어 하늘을 나는 새의 사진에서 모든 픽셀이 의미가 있을 수 있습니다."라고 설명했습니다. 데라오 카즈히로, SLAC 국립 가속기 연구소의 물리학자. 그러나 물리학자가 보는 이미지에서는 실제로 중요한 부분이 종종 있습니다. 이와 같은 상황에서 모든 세부 사항을 자세히 살펴보는 것은 불필요하게 시간과 계산 리소스를 소비합니다.

그러나 그것은 변화하기 시작했습니다. 희소 컨볼루션 신경망(SCNN)으로 알려진 기계 학습 도구를 사용하여 연구원은 데이터의 관련 부분에 집중하고 나머지는 걸러낼 수 있습니다. 연구원들은 이러한 네트워크를 사용하여 실시간 데이터 분석을 수행하는 능력을 크게 가속화했습니다. 그리고 그들은 적어도 XNUMX개 대륙에서 향후 또는 기존 실험에 SCNN을 사용할 계획입니다. 스위치는 물리학 커뮤니티의 역사적인 변화를 나타냅니다. 

"물리학에서 우리는 자체 알고리즘과 계산 접근 방식을 개발하는 데 익숙합니다."라고 말했습니다. 카를로스 아르겔레스-델가도, 하버드 대학의 물리학자. "우리는 항상 개발의 최전선에 있었지만 이제는 컴퓨터 과학이 앞장서고 있습니다." 

희소 문자

SCNN으로 이어지는 작업은 2012년에 시작되었습니다. 벤자민 그레이엄, 당시 Warwick 대학에서 중국어 손글씨를 인식할 수 있는 신경망을 만들고 싶었습니다. 

이와 같은 이미지 관련 작업을 위한 당시 최고의 도구는 CNN(컨볼루션 신경망)이었습니다. 중국어 필기 작업의 경우 작가는 디지털 태블릿에서 문자를 추적하여 예를 들어 10,000픽셀의 이미지를 생성합니다. 그런 다음 CNN은 전체 이미지에서 커널이라고 하는 3x3 격자를 이동하여 커널을 각 픽셀의 중앙에 개별적으로 배치합니다. 커널의 모든 배치에 대해 네트워크는 구별되는 기능을 찾는 컨볼루션이라는 복잡한 수학적 계산을 수행합니다.

CNN은 사진과 같은 정보 밀도가 높은 이미지와 함께 사용하도록 설계되었습니다. 그러나 한자를 포함하는 이미지는 대부분 비어 있습니다. 연구자들은 이 속성이 있는 데이터를 희소한 것으로 간주합니다. 그것은 자연계에 있는 모든 것의 공통적인 특징입니다. Graham은 "세상이 얼마나 희박할 수 있는지에 대한 예를 들기 위해" 에펠탑이 가능한 가장 작은 직사각형으로 둘러싸여 있다면 그 직사각형은 "99.98%의 공기와 0.02%의 철"로 구성될 것이라고 말했습니다.

개요

Graham은 CNN 접근 방식을 조정하여 커널이 3이 아닌 값을 갖는(단순히 비어 있지 않은) 픽셀이 하나 이상 포함된 이미지의 3x2013 섹션에만 배치되도록 했습니다. 이렇게 해서 손글씨 중국어를 효율적으로 식별할 수 있는 시스템을 만드는 데 성공했다. 2.61%의 오류율로 개별 문자를 식별하여 4.81년 대회에서 우승했습니다. (인간은 평균 XNUMX%를 기록했습니다.) 그는 다음으로 더 큰 문제인 XNUMX차원 물체 인식에 관심을 돌렸습니다.

2017년까지 Graham은 Facebook AI Research로 옮겨 자신의 기술을 더욱 다듬고 출판 전에, 세부설명 3이 아닌 값을 가진 픽셀에만 커널을 중앙에 배치한 첫 번째 SCNN의 경우(최소한 하나의 "3이 아닌" 픽셀이 있는 XNUMXxXNUMX 섹션에 커널을 배치하는 대신). 테라오가 입자물리학의 세계에 가져온 것은 바로 이 일반적인 생각이었습니다.

지하 촬영

Terao는 Fermi National Accelerator Laboratory에서 가장 파악하기 어려운 기본 입자 중 중성미자의 특성을 조사하는 실험에 참여하고 있습니다. 그들은 또한 질량을 가진 우주에서 가장 풍부한 입자이지만(많지는 않지만) 탐지기 내부에 거의 나타나지 않습니다. 결과적으로 대부분의 중성미자 실험 데이터는 희박했으며 Terao는 데이터 분석에 대한 더 나은 접근 방식을 지속적으로 모색했습니다. 그는 SCNN에서 하나를 찾았습니다.

2019년에 그는 SCNN을 Deep Underground Neutrino Experiment(DUNE)에서 예상되는 데이터의 시뮬레이션에 적용했습니다. 이 실험은 2026년에 온라인 상태가 되면 세계 최대의 중성미자 물리학 실험이 될 것입니다. 800마일의 지구를 통해 사우스다코타의 지하 실험실까지. 그 과정에서 입자는 세 가지 알려진 유형의 중성미자 사이에서 "진동"할 것이며 이러한 진동은 상세한 중성미자 특성을 드러낼 수 있습니다.

SCNN은 일반 방법보다 빠르게 시뮬레이션 데이터를 분석했으며 그렇게 하는 데 훨씬 적은 계산 능력이 필요했습니다. 유망한 결과는 실제 실험 실행 중에 SCNN이 사용될 가능성이 있음을 의미합니다.

한편 2021년에 Terao는 MicroBooNE로 알려진 Fermilab의 또 다른 중성미자 실험에 SCNN을 추가하는 것을 도왔습니다. 여기에서 과학자들은 중성미자와 아르곤 원자핵 사이의 충돌 여파를 조사합니다. 이러한 상호 작용에 의해 생성된 트랙을 조사함으로써 연구원은 원래 중성미자에 대한 세부 정보를 추론할 수 있습니다. 이를 위해서는 검출기의 XNUMX차원 표현에서 픽셀(또는 기술적으로 복셀이라고 하는 XNUMX차원 대응물)을 보고 어떤 픽셀이 어떤 입자 궤적과 연관되어 있는지 결정할 수 있는 알고리즘이 필요합니다.

데이터가 너무 희박하기 때문에(대형 검출기(약 170톤의 액체 아르곤) 내 작은 선이 흩어져 있음) SCNN은 이 작업에 거의 완벽합니다. 표준 CNN을 사용하면 수행해야 할 모든 계산 때문에 이미지를 50개 조각으로 나누어야 한다고 Terao는 말했습니다. "희소한 CNN을 사용하여 전체 이미지를 한 번에 분석하고 훨씬 빠르게 수행합니다."

적시 트리거

MicroBooNE에서 일한 연구원 중 한 명은 Felix Yu라는 학부 인턴이었습니다. SCNN의 성능과 효율성에 깊은 인상을 받은 그는 남극의 IceCube Neutrino Observatory와 공식적으로 제휴한 Harvard 연구 실험실의 대학원생으로서 다음 직장으로 도구를 가져왔습니다.

천문대의 주요 목표 중 하나는 우주에서 가장 에너지가 넘치는 중성미자를 가로채서 근원을 추적하는 것입니다. 대부분은 우리 은하 밖에 있습니다. 탐지기는 남극 얼음에 묻힌 5,160개의 광학 센서로 구성되어 있으며, 그 중 아주 작은 부분만이 주어진 시간에 빛을 발합니다. 어레이의 나머지 부분은 어둡게 유지되며 특별히 유익하지 않습니다. 설상가상으로 탐지기가 기록하는 많은 "이벤트"는 거짓 양성이며 중성미자 사냥에 유용하지 않습니다. 소위 트리거 레벨 이벤트만이 추가 분석을 위한 컷을 만들고 어떤 이벤트가 해당 지정에 합당하고 어떤 이벤트가 영구적으로 무시될 것인지에 대해 즉각적인 결정을 내려야 합니다.

표준 CNN은 이 작업에 비해 너무 느립니다. 따라서 IceCube 과학자들은 잠재적으로 유용한 탐지에 대해 알려주기 위해 LineFit이라는 알고리즘에 오랫동안 의존해 왔습니다. 그러나 그 알고리즘은 신뢰할 수 없다고 Yu는 말했습니다. "이는 우리가 흥미로운 이벤트를 놓칠 수 있다는 것을 의미합니다." 다시 말하지만 이것은 SCNN에 이상적으로 적합한 희소 데이터 환경입니다.

Yu는 박사 과정 지도교수인 Argüelles-Delgado 및 위스콘신 대학교 매디슨 대학원생인 Jeff Lazar와 함께 그 이점을 정량화하여 다음과 같이 보여주었습니다. 최근 신문 이러한 네트워크는 일반적인 CNN보다 약 20배 더 빠를 것입니다. Lazar는 “검출기에서 나오는 모든 이벤트에서 실행할 수 있을 만큼 충분히 빠릅니다.”라고 Lazar는 말했습니다. "그것은 우리가 무엇을 버리고 무엇을 유지할지에 대해 더 나은 결정을 내릴 수 있게 해줍니다."

개요

저자는 또한 공식 IceCube 데이터를 사용하여 시뮬레이션에서 SCNN을 성공적으로 사용했으며 다음 단계는 South Pole 컴퓨팅 시스템의 복제본에서 시스템을 테스트하는 것입니다. 모든 것이 순조롭게 진행된다면 Argüelles-Delgado는 내년에 남극 관측소에 시스템을 설치해야 한다고 생각합니다. 그러나이 기술은 훨씬 더 광범위하게 사용될 수 있습니다. "우리는 [SCNN이] IceCube뿐만 아니라 모든 중성미자 망원경에 도움이 될 수 있다고 생각합니다."라고 Argüelles-Delgado는 말했습니다.

뉴트리노 너머

Massachusetts Institute of Technology의 물리학자인 Philip Harris는 SCNN이 가장 큰 입자 충돌기인 CERN의 LHC(Large Hadron Collider)에서 도움이 되기를 바라고 있습니다. Harris는 MIT 동료인 컴퓨터 과학자 Song Han으로부터 이런 종류의 신경망에 대해 들었습니다. Harris는 "Song은 알고리즘을 빠르고 효율적으로 만드는 전문가"라고 말했습니다. 이는 매초 40천만 건의 충돌이 발생하는 LHC에 적합합니다.

몇 년 전 그들이 이야기했을 때 Song은 Harris에게 그가 연구실 구성원들과 함께 추진하고 있는 자율주행차 프로젝트에 대해 말했습니다. Song 팀은 전방에 장애물이 있는지 확인하기 위해 대부분 비어 있는 차량 앞 공간의 3D 레이저 맵을 SCNN을 사용하여 분석했습니다.

Harris와 그의 동료들은 LHC에서 비슷한 문제에 직면해 있습니다. 두 개의 양성자가 기계 내부에서 충돌하면 충돌로 인해 입자로 구성된 팽창하는 구가 생성됩니다. 이러한 입자 중 하나가 수집기에 부딪히면 2012차 입자 샤워가 발생합니다. Harris는 "만일 이 소나기의 전체 범위를 파악할 수 있다면 소나기를 발생시킨 입자의 에너지를 결정할 수 있습니다"라고 말했습니다. 이것은 특별한 관심의 대상이 될 수 있습니다. XNUMX년에 발견되었거나 물리학자들이 여전히 찾고 있는 암흑 물질 입자입니다.

“우리가 해결하려는 문제는 결국 점을 연결하는 것입니다.

SCNN은 LHC에서 데이터 분석 속도를 최소 50배 이상 높일 것이라고 Harris는 말했습니다. "우리의 궁극적인 목표는 [SCNN]을 감지기에 넣는 것입니다." — 최소 XNUMX년 이상의 서류 작업과 커뮤니티의 추가 동의가 필요한 작업입니다. 그러나 그와 그의 동료들은 희망적이다.

결국 컴퓨터 과학 분야에서 처음 고안된 아이디어인 SCNN이 곧 중성미자 물리학(DUNE), 중성미자 천문학(IceCube) 및 고에너지 물리학(LHC)에서 수행된 가장 큰 실험에서 중요한 역할을 할 가능성이 점점 높아지고 있습니다. .

Graham은 완전히 충격을 받은 것은 아니지만 SCNN이 입자 물리학에 진출했다는 사실을 알고 유쾌하게 놀랐다고 말했습니다. "추상적인 의미에서" 그는 "공간에서 움직이는 입자는 종이 위에서 움직이는 펜 끝과 약간 비슷합니다."라고 말했습니다.

spot_img

최신 인텔리전스

spot_img

우리와 함께 채팅

안녕하세요! 어떻게 도와 드릴까요?