제퍼넷 로고

AI가 발견한 타원곡선 '잔소리' | 콴타 매거진

시간

개요

타원 곡선은 현대 수학에서 가장 흥미로운 대상 중 하나입니다. 복잡해 보이지는 않지만 많은 사람들이 고등학교에서 배우는 수학과 가장 난해한 수학 연구 사이에 고속도로를 형성합니다. 이는 1990년대 Andrew Wiles의 유명한 페르마의 마지막 정리 증명의 핵심이었습니다. 이는 현대 암호화의 핵심 도구입니다. 그리고 2000년에 클레이 수학 연구소(Clay Mathematics Institute)는 통계에 대한 추측 타원 곡선은 1가지 "밀레니엄 상 문제" 중 하나이며, 각 문제 해결 시 상금이 XNUMX만 달러에 이릅니다. 그 추측은 처음에 브라이언 버치피터 스위너튼-다이어 1960년대에는 아직까지 증명되지 않았습니다.

타원 곡선을 이해하는 것은 수학의 중심이 되어온 중요한 노력입니다. 따라서 2022년에 대서양 횡단 협력이 통계 기법과 인공 지능을 사용하여 타원 곡선에서 완전히 예상치 못한 패턴을 발견했을 때 이는 예상치 못한 기여였지만 환영할 만한 기여였습니다. "머신 러닝이 흥미로운 것을 가지고 우리 집 문앞에 상륙하는 것은 시간 문제였습니다."라고 말했습니다. 피터 사르 낙, 고등연구소와 프린스턴 대학교의 수학자. 처음에는 새로 발견된 패턴이 왜 존재하는지 설명할 수 있는 사람이 아무도 없었습니다. 그 이후로 최근 일련의 논문에서 수학자들은 찌르레기 무리의 유동적인 모양과 유사하기 때문에 "중얼거림"이라고 불리는 패턴 뒤에 있는 이유를 밝히기 시작했으며 이러한 패턴이 특정 특정 영역에서만 발생하는 것이 아니라는 것을 증명하기 시작했습니다. 2022년에 조사된 예이지만 더 일반적으로는 타원 곡선입니다.

타원의 중요성

이러한 패턴이 무엇인지 이해하려면 타원 곡선이 무엇인지, 수학자들이 이를 어떻게 분류하는지에 대한 약간의 기초를 마련해야 합니다.

타원 곡선은 일반적으로 다음과 같이 작성되는 한 변수의 제곱과 관련됩니다. y, 다른 사람의 세 번째 거듭제곱으로, 일반적으로 다음과 같이 작성됩니다. x: y2 = x3 + Ax + B, 일부 숫자 쌍의 경우 AB,만큼 AB 몇 가지 간단한 조건을 충족합니다. 이 방정식은 아래와 같이 평면에 그래프로 표시할 수 있는 곡선을 정의합니다. (이름의 유사성에도 불구하고 타원은 타원 곡선이 아닙니다.)

개요

평범해 보이는 타원 곡선은 정수의 패턴을 찾는 수학자인 정수 이론가들에게는 믿을 수 없을 정도로 강력한 도구임이 밝혀졌습니다. 변수를 허용하는 대신 xy 범위가 모든 숫자에 걸쳐 있는 경우, 수학자들은 이를 다른 숫자 체계로 제한하기를 좋아합니다. 이를 주어진 숫자 체계 "위"에 대한 곡선 정의라고 부릅니다. 유리수(분수로 쓸 수 있는 숫자)로 제한된 타원 곡선은 특히 유용합니다. "실수 또는 복소수에 대한 타원 곡선은 상당히 지루합니다"라고 Sarnak은 말했습니다. "깊은 것은 오직 합리적인 숫자일 뿐입니다."

이것이 사실인 한 가지 방법이 있습니다. 타원 곡선의 두 유리점 사이에 직선을 그리면 그 선이 곡선과 다시 교차하는 지점도 유리점이 됩니다. 아래와 같이 이 사실을 사용하여 타원 곡선의 "덧셈"을 정의할 수 있습니다.

개요

사이에 선을 그어라 PQ. 그 선은 세 번째 점에서 곡선과 교차합니다. R. (수학자들은 선이 곡선과 교차하지 않는 경우를 처리하기 위해 "무한점"을 추가하는 특별한 방법을 가지고 있습니다.) R 전체 x-축은 당신의 합계입니다 P + Q. 이 덧셈 연산과 함께 곡선에 대한 모든 해는 그룹이라는 수학적 개체를 형성합니다.

수학자들은 이를 사용하여 곡선의 "순위"를 정의합니다. 그만큼 곡선의 순위 합리적인 솔루션의 수와 관련이 있습니다. 순위 0 곡선에는 유한한 수의 해가 있습니다. 순위가 더 높은 곡선에는 덧셈 연산을 사용하는 서로의 관계가 순위로 설명되는 무한한 수의 솔루션이 있습니다.

순위는 잘 이해되지 않습니다. 수학자들은 항상 그것을 계산할 수 있는 방법을 가지고 있지 않으며 그것이 얼마나 커질 수 있는지 모릅니다. (특정 곡선에 대해 알려진 가장 큰 정확한 순위는 20입니다.) 유사해 보이는 곡선은 완전히 다른 순위를 가질 수 있습니다.

타원 곡선은 또한 1과 자기 자신으로만 나누어지는 소수와 많은 관련이 있습니다. 특히 수학자들은 각 소수에 대해 정의된 순환 산술 시스템인 유한 필드 위의 곡선을 살펴봅니다. 유한 필드는 소수와 동일한 시간 수를 갖는 시계와 같습니다. 계속 위쪽으로 세면 숫자가 다시 시작됩니다. 예를 들어 7에 대한 유한장에서 5 더하기 2는 5이고, 3 더하기 1은 XNUMX입니다.

개요

타원 곡선에는 다음과 같은 일련의 숫자가 연관되어 있습니다. ap, 이는 소수에 의해 정의된 유한 필드의 곡선에 대한 해의 수와 관련됩니다. p. 더 작게 ap 더 많은 솔루션을 의미합니다. 더 큰 ap 솔루션이 적다는 것을 의미합니다. 순위를 계산하기는 어렵지만 순서는 ap 훨씬 쉽습니다.

최초의 컴퓨터 중 하나에서 수행된 수많은 계산을 기반으로 Birch와 Swinnerton-Dyer는 타원 곡선의 순위와 시퀀스 사이의 관계를 추측했습니다. ap. 자신이 옳았다는 것을 증명할 수 있는 사람은 누구나 백만 달러와 수학 불멸을 얻을 수 있습니다.

놀라운 패턴이 나타난다

대유행이 시작된 이후, 허양희런던 수리과학 연구소의 연구원인 는 몇 가지 새로운 도전에 나서기로 결정했습니다. 그는 대학에서 물리학을 전공했고 매사추세츠 공과대학에서 수리물리학 박사 학위를 받았습니다. 그러나 그는 정수론에 점점 더 관심을 갖게 되었고, 인공지능의 능력이 향상됨에 따라 숫자에서 예상치 못한 패턴을 찾기 위한 도구로 AI를 사용해 보고 싶다고 생각했습니다. (그는 이미 기계 학습을 사용하여 분류하다 Calabi-Yau 매니폴드, 끈 이론에서 널리 사용되는 수학적 구조입니다.)

개요

2020년 XNUMX월, 팬데믹이 심화되자 노팅엄 대학교는 그를 초대했습니다. 온라인 토크. 그는 자신의 발전과 새로운 수학을 발견하기 위해 기계 학습을 사용할 가능성에 대해 비관적이었습니다. "그의 이야기는 정수론에서는 기계 학습을 할 수 없기 때문에 정수론이 어렵다는 것이었습니다."라고 말했습니다. 토마스 올리버, 청중에 있던 웨스트민스터 대학의 수학자. 그는 “나는 전문가가 아니어서 아무것도 찾을 수 없었다”고 기억한다. 나는 이것을 보는 데 올바른 것을 사용하지도 않았습니다.”

올리버와 이규환코네티컷 대학의 수학자인 그는 He와 함께 일하기 시작했습니다. 올리버는 “우리는 수학을 진지하게 공부하기보다는 단지 머신러닝이 무엇인지 배우기 위해 이 일을 하기로 결정했습니다.”라고 말했습니다. "하지만 우리는 많은 것을 기계 학습할 수 있다는 것을 금방 알아냈습니다."

올리버와 리는 자신의 기술을 적용하여 조사해 보라고 제안했습니다. L-함수, 수열을 통해 타원곡선과 밀접하게 관련된 무한급수 ap. 그들은 타원 곡선과 관련된 온라인 데이터베이스를 사용할 수 있습니다. L-라고 불리는 함수 LMFDB 기계 학습 분류기를 훈련합니다. 당시 데이터베이스에는 유리수에 대한 타원 곡선이 3만 개가 조금 넘었습니다. 2020년 XNUMX월까지 그들은 종이 에서 수집한 정보를 사용했습니다. L- 타원 곡선의 특정 속성을 예측하는 기능. 11월에 그들은 공유했습니다. 다른 종이 기계 학습을 사용하여 정수 이론으로 다른 개체를 분류했습니다. 12월까지 그들은 할 수 있었다 타원 곡선의 순위 예측 높은 정확도로.

그러나 그들은 기계 학습 알고리즘이 왜 그렇게 잘 작동하는지 확신하지 못했습니다. Lee는 학부생 Alexey Pozdnyakov에게 무슨 일이 일어나고 있는지 알아낼 수 있는지 물어봤습니다. 공교롭게도 LMFDB는 도체라는 양에 따라 타원 곡선을 정렬하는데, 도체는 곡선이 제대로 작동하지 않는 소수에 대한 정보를 요약합니다. 그래서 Pozdnyakov는 유사한 도체가 있는 수많은 곡선, 즉 7,500에서 10,000개 사이의 도체가 있는 모든 곡선을 동시에 살펴보았습니다.

개요

이는 총 약 10,000개의 곡선에 해당합니다. 이들 중 약 절반은 순위 0이고 절반은 순위 1이었습니다. (더 높은 순위는 매우 드뭅니다.) 그런 다음 그는 다음 값의 평균을 냈습니다. ap 모든 순위 0 곡선에 대해 별도로 평균을 냄 ap 모든 랭크 1 곡선에 대해 결과를 플롯했습니다. 두 세트의 점은 두 개의 뚜렷하고 쉽게 식별할 수 있는 파동을 형성했습니다. 이것이 머신러닝 분류기가 특정 곡선의 순위를 정확하게 확인할 수 있었던 이유입니다.

Pozdnyakov는 "처음에는 임무를 완수했다는 사실에 기뻤습니다."라고 말했습니다. “그런데 규환이는 이 패턴이 의외라는 걸 바로 알아차렸고, 그때부터 정말 흥미로웠어요.”

Lee와 Oliver는 매료되었습니다. 올리버는 “알렉세이가 우리에게 사진을 보여줬는데 새들이 하는 것과 비슷하다고 말했다”고 말했다. 그러다 규환이가 찾아보더니 으르렁거린다고 했고, 양씨는 신문에 전화하자고 하더군요.타원 곡선의 중얼거림. ""

그들은 2022년 XNUMX월에 논문을 업로드하고 소수의 다른 수학자들에게 전달했으며, 소위 "발견"이 잘 알려져 있다는 말을 듣게 될 것이라고 초조하게 기대했습니다. 올리버는 그 관계가 너무 눈에 띄어서 오래 전에 눈치챘어야 했다고 말했다.

개요

거의 즉시, 사전 인쇄는 특히 다음과 같은 사람들의 관심을 끌었습니다. 앤드류 서덜랜드, LMFDB의 편집장 중 한 명인 MIT의 연구 과학자입니다. 서덜랜드는 3백만 개의 타원 곡선만으로는 그의 목적에 충분하지 않다는 것을 깨달았습니다. 그는 잡음이 얼마나 강력한지 확인하기 위해 훨씬 더 넓은 도체 범위를 살펴보고 싶었습니다. 그는 약 150억 300천만 개의 타원 곡선이 있는 또 다른 거대한 저장소에서 데이터를 가져왔습니다. 여전히 만족스럽지 못한 그는 XNUMX억 개의 곡선이 있는 다른 저장소에서 데이터를 가져왔습니다.

"그러나 그것만으로는 충분하지 않았기 때문에 실제로 15,000억 개가 넘는 타원 곡선으로 구성된 새로운 데이터 세트를 계산했고, 이것이 바로 고해상도 사진을 계산하는 데 사용된 것입니다."라고 Sutherland는 말했습니다. 중얼거림은 그가 한 번에 평균 XNUMX개 이상의 타원 곡선을 얻었는지, 아니면 한 번에 백만 개를 초과했는지를 보여주었습니다. 점점 더 큰 소수에 대한 곡선을 볼 때에도 모양은 동일하게 유지되었습니다. 이는 척도 불변성이라고 불리는 현상입니다. Sutherland는 또한 중얼거림이 타원 곡선에만 나타나는 것이 아니라 보다 일반적인 현상에서도 나타난다는 것을 깨달았습니다. L-기능. 그가 썼다 그의 연구 결과를 요약한 편지 그것을 Sarnak에게 보냈고 마이클 루빈스타인 워털루 대학교에서.

“만약 이에 대해 알려진 설명이 있다면 당신도 그것을 알게 될 것이라고 기대합니다.”라고 Sutherland는 썼습니다.

그들은하지 않았다.

패턴 설명

이희와 올리버는 2023년 XNUMX월 브라운대학교 수학계산실험연구소(ICERM)에서 중얼거림에 관한 워크숍을 개최했습니다. Sarnak과 Rubinstein이 왔고 Sarnak의 학생도 왔습니다. 니나 주브릴리나.

Zubrilina는 중얼거림 패턴에 대한 연구를 다음과 같이 발표했습니다. 모듈식 형태, 타원 곡선과 같이 연관된 특수 복합 함수 L-기능. 대형 도체가 있는 모듈식 형태에서는 잡음이 식별 가능하지만 분산된 패턴을 형성하기보다는 예리하게 정의된 곡선으로 수렴됩니다. ~ 안에 종이 11년 2023월 XNUMX일에 게시된 Zubrilina는 이러한 유형의 중얼거림이 자신이 발견한 명시적인 공식을 따른다는 것을 증명했습니다.

“Nina의 가장 큰 성취는 이에 대한 공식을 제시했다는 것입니다. 나는 이것을 Zubrilina 중얼거림 밀도 공식이라고 부릅니다.”라고 Sarnak은 말했습니다. "그녀는 매우 정교한 수학을 사용하여 데이터에 완벽하게 맞는 정확한 공식을 입증했습니다."

그녀의 공식은 복잡하지만 Sarnak은 이를 광학에서 양자 역학에 이르기까지 물리학의 다양한 맥락에서 사용되는 미분 방정식의 해를 정의하는 Airy 함수와 비교할 수 있는 중요한 새로운 종류의 함수로 환영합니다.

Zubrilina의 공식이 처음이었지만 다른 사람들도 뒤따랐습니다. Sarnak은 "주로 Zubrilina의 도구를 사용하여 중얼거림의 다른 측면을 설명하는 새로운 논문이 매주 나옵니다."라고 말했습니다.

조나단 보버, 앤드류 부커이민 브리스톨 대학교와 함께 데이비드 라우리-두다 ICERM의 모듈식 형태로 다른 유형의 중얼거림이 존재함을 입증했습니다. 또 다른 10월 논문. 그리고 이규환, 올리버, 포즈드냐코프 존재를 증명했다 와 밀접하게 관련된 Dirichlet 문자라고 불리는 물체에서 중얼거리는 소리가 들립니다. L-기능.

Sutherland는 잡음을 발견하게 된 상당한 행운에 깊은 인상을 받았습니다. 타원 곡선 데이터가 도체별로 정렬되지 않았다면 잡음이 사라졌을 것입니다. “차장에 따라 미리 분류된 LMFDB에서 데이터를 얻을 수 있었던 것은 행운이었습니다.”라고 그는 말했습니다. “그것은 타원 곡선을 해당 모듈 형태와 연관시키는 것이지만 전혀 명확하지 않습니다. … 방정식이 매우 유사해 보이는 두 곡선은 매우 다른 도체를 가질 수 있습니다.” 예를 들어 Sutherland는 다음과 같이 언급했습니다. y2 = x3 - 11x + 6에는 도체 17이 있지만 마이너스 기호를 플러스 기호로 바꾸면, y2 = x3 + 11x + 6에는 도체 100,736이 있습니다.

그럼에도 불구하고 중얼거리는 소리는 Pozdnyakov의 경험 부족으로 인해 발견되었습니다. 올리버는 이렇게 말했습니다. “그가 없었다면 우리는 그것을 발견하지 못했을 것입니다. 왜냐하면 전문가들은 전통적으로 정규화를 하기 때문입니다. ap 절대값 1을 가지려고 합니다. 그러나 그는 그것을 정규화하지 않았습니다… 그래서 진동은 매우 크고 눈에 띕니다.”

AI 알고리즘이 순위별로 타원 곡선을 정렬하는 데 사용하는 통계 패턴은 수백 개의 차원이 있는 매개변수 공간에 존재합니다. Oliver는 이렇게 지적했습니다. 그러나 기계 학습이 숨겨진 진동을 발견했지만 "나중에야 우리는 그것이 중얼거림이라는 것을 이해했습니다."

편집자 주: Andrew Sutherland, 이규환 및 L-function 및 모듈형 양식 데이터베이스(LMFDB)는 모두 Simons Foundation으로부터 자금을 지원받았으며, 편집적으로 독립된 이 간행물에도 자금을 지원했습니다. Simons Foundation 기금 결정은 우리의 보장 범위에 영향을 미치지 않습니다. 더 많은 정보를 이용할 수 있습니다 여기에서 지금 확인해 보세요..

spot_img

최신 인텔리전스

spot_img