제퍼넷 로고

Google DeepMind의 새로운 AI가 수학 올림픽에서 금메달을 땄습니다.

시간

풀리지 않는 수학을 깨다 작년에 문제가 발생한 AI는 다시 기하학 문제를 해결하기 위해 돌아왔습니다.

Google DeepMind가 개발한 새로운 알고리즘인 AlphaGeometry는 고등학생을 위한 최고 수준의 경쟁인 과거 국제 수학 올림피아드의 문제를 해결하고 이전 금메달리스트의 성과와 일치할 수 있습니다.

30개의 어려운 기하학 문제에 도전했을 때 AI는 표준 할당 시간 내에 25개를 성공적으로 해결하여 이전의 최첨단 알고리즘을 15개의 답변보다 앞섰습니다.

종종 고등학교 수학 수업의 골칫거리로 여겨지지만 기하학은 우리 일상생활에 깊이 자리잡고 있습니다. 예술, 천문학, 인테리어 디자인, 건축은 모두 기하학에 의존합니다. 내비게이션, 지도, 경로 계획도 마찬가지입니다. 기본적으로 기하학은 논리적 추론을 사용하여 공간, 모양 및 거리를 설명하는 방법입니다.

어떤 면에서 기하학 문제를 해결하는 것은 체스를 두는 것과 비슷합니다. 정리 및 증명이라고 하는 몇 가지 규칙이 주어지면 각 단계에 대한 솔루션의 수가 제한되어 있지만 어느 것이 의미가 있는지 찾는 것은 엄격한 수학적 규칙을 따르는 유연한 추론에 달려 있습니다.

즉, 기하학을 다루려면 창의성과 구조가 모두 필요합니다. 인간은 수년간의 연습을 통해 이러한 정신적 곡예 기술을 개발하는 반면 AI는 항상 어려움을 겪었습니다.

AlphaGeometry는 두 기능을 하나의 시스템으로 교묘하게 결합합니다. 여기에는 답을 찾으려고 시도하는 규칙 바인딩 논리 모델과 즉시 사용 가능한 아이디어를 생성하는 대규모 언어 모델이라는 두 가지 주요 구성 요소가 있습니다. AI가 논리적 추론만으로 솔루션을 찾지 못하면 언어 모델이 시작되어 새로운 각도를 제공합니다. 그 결과, 솔루션을 설명할 수 있는 창의성과 추론 능력을 모두 갖춘 AI가 탄생했습니다.

이 시스템은 기계 지능으로 수학적 문제를 해결하려는 DeepMind의 최신 시도입니다. 그러나 그들의 눈은 더 큰 목표를 향해 있습니다. AlphaGeometry는 혼란스러운 일상 세계와 같은 복잡한 환경에서 논리적 추론을 위해 제작되었습니다. 수학 외에도 미래의 반복은 과학자들이 뇌 연결을 해독하거나 질병으로 이어지는 유전적 웹을 풀어내는 등 다른 복잡한 시스템에서 해결책을 찾는 데 잠재적으로 도움이 될 수 있습니다.

연구 저자인 Trieu Trinh 박사는 “우리는 결과 측면에서 큰 도약, 획기적인 발전을 이루고 있습니다.”라고 말했습니다. 이야기 전에, 뉴욕 타임스.

더블 팀

간단한 기하학 질문: 양쪽 변의 길이가 같은 삼각형을 상상해 보세요. 아래쪽 두 각도가 정확히 같다는 것을 어떻게 증명합니까?

이는 AlphaGeometry가 직면한 첫 번째 과제 중 하나입니다. 문제를 해결하려면 기하학의 규칙을 완전히 이해해야 하지만 답을 향해 조금씩 나아가는 창의성도 필요합니다.

"정리 증명은 논리적 추론의 숙달을 보여줍니다. 이는 놀라운 문제 해결 기술을 의미합니다."라고 팀은 말합니다. 오늘 발표된 연구에 썼습니다. 자연.

AlphaGeometry의 아키텍처가 탁월한 부분이 바로 여기에 있습니다. 더빙 신경상징체계, 먼저 상징적 추론 엔진의 문제를 해결합니다. 이러한 알고리즘을 수학 교과서를 엄격하게 공부하고 규칙을 따르는 A학년 학생으로 상상해 보세요. 논리에 따라 안내되며 수학 시험에서 일련의 추론을 설명하는 것과 같이 솔루션으로 이어지는 모든 단계를 쉽게 배치할 수 있습니다.

이러한 시스템은 구식이지만 현대 딥러닝 알고리즘의 대부분을 괴롭히는 "블랙박스" 문제가 없다는 점에서 믿을 수 없을 정도로 강력합니다.

딥러닝은 우리의 세계를 변화시켰습니다. 그러나 이러한 알고리즘의 작동 방식으로 인해 결과를 설명할 수 없는 경우가 많습니다. 이것은 기록할 수 있는 엄격한 논리적 추론에 의존하는 수학의 경우에는 적합하지 않습니다.

상징적 추론 엔진은 합리적이고 설명 가능하다는 점에서 블랙박스 문제에 대응합니다. 하지만 복잡한 문제에 직면하면 느리고 유연하게 적응하는 데 어려움을 겪습니다.

여기에 대규모 언어 모델이 등장합니다. ChatGPT의 원동력인 이러한 알고리즘은 훈련 데이터가 충분할 경우 복잡한 데이터에서 패턴을 찾고 새로운 솔루션을 생성하는 데 탁월합니다. 하지만 스스로 설명하는 능력이 부족하여 결과를 다시 확인해야 하는 경우가 많습니다.

AlphaGeometry는 두 세계의 장점을 결합합니다.

기하학 문제에 직면하면 기호 추론 엔진이 먼저 문제를 해결합니다. 삼각형 문제를 풀어보세요. 알고리즘은 아래쪽 두 각도가 동일하다는 것을 증명해야 한다는 점에서 질문의 전제를 "이해"합니다. 그런 다음 언어 모델은 문제 해결에 도움이 되도록 삼각형의 상단에서 하단까지 직선으로 새 선을 그릴 것을 제안합니다. AI를 솔루션 쪽으로 이동시키는 각각의 새로운 요소를 "구성체"라고 합니다.

기호 추론 엔진은 조언을 받아들여 추론 뒤에 숨어 있는 논리를 기록합니다. 구성이 작동하지 않으면 AlphaGeometry가 솔루션에 도달할 때까지 두 시스템은 여러 차례의 숙고를 거칩니다.

전체 설정은 "'생각하기, 빠르고 느리게'라는 개념과 유사합니다." DeepMind 블로그의 팀. "한 시스템은 빠르고 '직관적인' 아이디어를 제공하고, 다른 시스템은 보다 신중하고 합리적인 의사결정을 제공합니다."

우리가 챔피언이다

텍스트나 오디오 파일과 달리 기하학에 초점을 맞춘 예제가 부족하여 AlphaGeometry를 훈련시키기가 어려웠습니다.

해결 방법으로 팀에서는 임의의 기하학적 모양과 점과 선 사이의 매핑된 관계에 대한 100억 개의 합성 예시가 포함된 자체 데이터세트를 생성했습니다. 이는 수학 수업에서 기하학을 푸는 방법과 유사하지만 훨씬 더 큰 규모입니다.

거기에서 AI는 기하학의 규칙을 파악하고 솔루션에서 거꾸로 작업하여 구성을 추가해야 하는지 파악하는 방법을 배웠습니다. 이 주기를 통해 AI는 사람의 입력 없이 처음부터 학습할 수 있었습니다.

AI를 테스트하기 위해 팀은 30년이 넘는 이전 대회에서 나온 XNUMX개의 올림피아드 문제로 AI에 도전했습니다. 생성된 결과는 이전 올림피아드 금메달리스트인 Evan Chen이 평가하여 품질을 보장했습니다.

전체적으로 AI는 과거 금메달리스트의 성적과 일치하여 제한 시간 내에 25개의 문제를 완료했습니다. 그만큼 이전의 최신 결과 정답은 10개였습니다.

"AlphaGeometry의 출력은 검증 가능하고 깔끔하기 때문에 인상적입니다." Chen 말했다. "학생들처럼 각도와 유사 삼각형이 포함된 고전 기하학 규칙을 사용합니다."

수학을 넘어

AlphaGeometry는 DeepMind의 최신 수학 분야 진출입니다. 2021에서, 그들의 AI는 수십 년 동안 인간을 당황하게 했던 수학 퍼즐을 풀었습니다. 최근에는 그들은 사용했다 대학 수준에서 STEM 문제를 추론하는 대규모 언어 모델 금이 간 알고리즘을 사용한 카드 게임을 기반으로 한 이전에는 "풀 수 없었던" 수학 문제 재미있는 검색.

현재 AlphaGeometry는 기하학에 맞춰져 있으며 주의 사항이 있습니다. 대부분의 형상은 시각적이지만 시스템은 도면을 "볼" 수 없으므로 문제 해결이 빨라질 수 있습니다. 아마도 이미지 추가하기 구글의 제미니 AI작년 말에 출시된 는 기하학적 스마트함을 강화할 수 있습니다.

유사한 전략을 통해 AlphaGeometry의 범위를 창의성이 가미된 엄격한 추론이 필요한 광범위한 과학 영역으로 확장할 수도 있습니다. (현실적으로 생각해보자. 그게 전부다.)

“대규모 합성 데이터를 사용하여 처음부터 AI 시스템을 훈련할 수 있는 더 넓은 잠재력을 고려할 때 이 접근 방식은 미래의 AI 시스템이 수학과 그 이상에서 새로운 지식을 발견하는 방법을 형성할 수 있습니다.”라고 팀은 썼습니다.

이미지 신용 : 조엘 필리페 / Unsplash 

spot_img

VC 카페

VC 카페

최신 인텔리전스

spot_img