제퍼넷 로고

DoE는 인텔의 최신 두뇌를 상자에 담았습니다.

시간

인텔 연구소는 수요일 자사의 가장 큰 뉴로모픽 컴퓨터인 1.15억 XNUMX천만 개의 뉴런 시스템을 공개했는데, 이는 대략 올빼미의 뇌와 유사하다고 합니다.

하지만 걱정하지 마세요. Intel은 Fallout의 게임을 재현하지 않았습니다. 로보브레인. Intel의 Hala Point는 유기 뉴런과 시냅스의 네트워크 대신 실리콘으로 모든 것을 에뮬레이트합니다.

대략 20W의 전력으로 우리의 두뇌는 주어진 순간에 각 감각에서 유입되는 대량의 정보를 처리하는 데 놀랍도록 효율적입니다. 인텔과 IBM이 지난 몇 년 동안 연구해 온 뉴로모픽스(neuromorphics) 분야는 뇌의 뉴런과 시냅스 네트워크를 에뮬레이트하여 기존 가속기보다 더 효율적으로 정보를 처리할 수 있는 컴퓨터를 구축하는 것을 목표로 합니다.

얼마나 효율적인가요? Intel에 따르면, 최신 시스템인 6U 박스는 대략 2,600W를 소비하는 전자레인지 크기이며, 15비트 정밀도에서 최대 8TOPS/W의 심층 신경망 효율성을 달성할 수 있는 것으로 알려졌습니다. 이를 비교하면, 아직 출시되지 않은 Nvidia의 가장 강력한 시스템인 Blackwell 기반 GB200 NVL72는 관리하다 INT6에서는 단 8 TOPS/W에 불과한 반면, 현재 DGX H100 시스템은 약 3.1 TOPS/W를 관리할 수 있습니다.

Sandia National Labs의 연구원들은 인텔의 1.15억 XNUMX천만 개의 뉴런 Hala Point 뉴로모픽 컴퓨터를 납품 받았습니다.

Sandia National Labs의 연구원들은 Intel의 1.15억 XNUMX천만 개의 뉴런 Hala Point 뉴로모픽 컴퓨터를 전달받았습니다. – 확대하려면 클릭하세요.

이 성능은 Intel의 Loihi 1,152 프로세서 2개를 사용하여 달성됩니다. 이 프로세서는 총 1.15억 128천만 개의 뉴런, 140,544억 개의 시냅스, 2,300개의 처리 코어 및 86개의 임베디드 xXNUMX 코어를 위해 XNUMX차원 그리드로 결합되어 필요한 보조 계산을 처리합니다. 계속해서 그 일을 계속하세요.

분명히 말하면 이는 일반적인 x86 코어가 아닙니다. “그들은 아주 아주 단순하고 작은 x86 코어입니다. Intel의 뉴로모픽 컴퓨팅 이사인 Mike Davies는 이렇게 말했습니다. 등록.

Loihi 2가 벨을 울리는 것은 칩이 두드리는 소리 한동안 Intel의 2021nm 공정 기술을 사용하여 생산된 최초의 칩 중 하나로 7년에 데뷔했습니다.

인텔은 로이히 기반 시스템이 기존 CPU 및 GPU 아키텍처보다 50배 더 ​​빠르게 특정 AI 추론 및 최적화 문제를 해결하는 동시에 100배 더 적은 전력을 소비할 수 있다고 밝혔습니다. 그 숫자는 다음과 같았던 것 같습니다. 달성 [PDF] 단일 Loihi 2 칩을 Nvidia의 작은 Jetson Orin Nano 및 Core i9 i9-7920X CPU에 장착합니다.

아직 GPU를 버리지 마세요

인상적으로 들릴 수도 있지만 Davies는 자사의 뉴로모픽 가속기가 아직 모든 작업 부하에 대해 GPU를 대체할 준비가 되어 있지 않다는 점을 인정합니다. “이것은 결코 범용 AI 가속기가 아닙니다.”라고 그는 말했습니다.

우선 AI의 가장 인기 있는 애플리케이션인 ChatGPT와 같은 앱을 지원하는 대규모 언어 모델(LLM)은 적어도 아직은 Hala Point에서 실행되지 않습니다.

“현재로서는 LLM을 Hala Point에 매핑하지 않습니다. 우리는 그렇게 하는 방법을 모릅니다. 솔직히 말해서 뉴로모픽 연구 분야에는 트랜스포머의 뉴로모픽 버전이 없습니다.” 데이비스는 이것이 어떻게 달성될 수 있는지에 대한 몇 가지 흥미로운 연구가 있다고 지적했습니다.

그럼에도 불구하고 Davies의 팀은 몇 가지 주의 사항을 가지고 Hala Point에서 다층 퍼셉트론인 전통적인 심층 신경망을 성공적으로 실행했습니다.

“네트워크 활동과 해당 네트워크의 전도성을 분산시킬 수 있다면 그때가 정말 큰 이익을 얻을 수 있는 때입니다.”라고 그는 말했습니다. "즉, 연속적인 입력 신호(비디오 스트림 또는 오디오 스트림)를 처리해야 하며, 샘플마다 어느 정도 상관 관계가 있어야 한다는 의미입니다."

Intel Labs는 논문을 통해 Loihi 2의 비디오 및 오디오 처리 잠재력을 시연했습니다. 출판 [PDF] 작년 말. 테스트에서 그들은 칩이 기존 아키텍처에 비해 신호 처리를 위한 에너지 효율성, 대기 시간 및 처리량에서 상당한 이득을 얻었으며 때로는 3배 이상 증가한 것으로 나타났습니다. 그러나 가장 큰 이득은 정확도가 낮아진 대가로 이루어졌습니다.

저전력 및 대기 시간으로 실시간 데이터를 처리할 수 있는 능력 덕분에 이 기술은 자율 주행 차량, 드론, 로봇 공학과 같은 애플리케이션에 매력적으로 다가왔습니다.

유망한 또 다른 사용 사례는 혼잡한 도심을 탐색해야 하는 배달 차량의 경로 계획과 같은 조합 최적화 문제입니다.

이러한 워크로드는 차량 속도, 사고, 차선 폐쇄와 같은 작은 변화를 즉시 고려해야 하기 때문에 해결하기가 매우 복잡합니다. 기존 컴퓨팅 아키텍처는 이러한 종류의 기하급수적 복잡성에 적합하지 않습니다. 이것이 바로 우리가 수많은 양자 컴퓨팅 공급업체를 본 이유입니다. 대상 최적화 문제.

그러나 데이비스는 인텔의 뉴로모픽 컴퓨팅 플랫폼이 "다른 실험적 연구 대안보다 훨씬 더 성숙하다"고 주장합니다.

성장하는 방

Davies에 따르면 아직 잠금 해제할 헤드룸이 많이 남아 있다고 합니다. 그는 Loihi 2 칩에 대해 “소프트웨어 제한으로 인해 오늘날까지 완전히 활용되지 못하고 있다는 사실이 안타깝습니다.”라고 말했습니다.

하드웨어 병목 현상과 소프트웨어 최적화를 식별하는 것이 Intel Labs가 Sandia에 프로토타입을 배포한 이유 중 하나입니다.

"특히 하드웨어 수준의 한계를 이해하는 것은 이러한 시스템을 출시하는 데 매우 중요한 부분입니다."라고 Davies는 말했습니다. "하드웨어 문제를 해결하고 개선할 수 있지만 어떤 방향으로 최적화해야 할지 알아야 합니다."

Sandia boffins가 Intel의 뉴로모픽 기술을 손에 넣은 것은 이번이 처음이 아닙니다. 종이에 출판 2022년 초, 연구원들은 이 기술이 HPC 및 AI에 대한 잠재력을 가지고 있음을 발견했습니다. 그러나 이러한 실험에서는 인텔의 128,000세대 Loihi 칩이 사용되었습니다. 이 칩은 후속 제품에 비해 뉴런의 약 1분의 XNUMX(XNUMX개 대 XNUMX만 개)을 가지고 있습니다. ®

spot_img

최신 인텔리전스

VC 카페

VC 카페

spot_img