ゼファーネットのロゴ

AI で発見された楕円曲線の「つぶやき」 Take Flight |クアンタマガジン

日付:

概要

楕円曲線は、現代数学の中でも最も魅力的なオブジェクトの 1990 つです。複雑そうには見えませんが、多くの人が高校で学ぶ数学と、最も難解な数学の研究との間に高速道路を形成しています。それらは、2000 年代のアンドリュー ワイルズの有名なフェルマーの最終定理の証明の中心でした。これらは現代の暗号化における重要なツールです。そして XNUMX 年に、クレイ数学研究所は 統計に関する推測 楕円曲線の 1 つの「ミレニアム懸賞問題」の XNUMX つであり、それぞれの解には XNUMX 万ドルの賞金が与えられます。その推測を最初に試みたのは、 ブライアン・バーチ & ピーター・スウィナートン・ダイアー 1960年代にはまだ証明されていません。

楕円曲線を理解することは、数学の中心となってきた一か八かの努力です。そのため、2022 年に大西洋を越えた共同研究が統計手法と人工知能を使用して楕円曲線の全く予想外のパターンを発見したとき、それは予想外ではあったとしても歓迎すべき貢献でした。 「機械学習が興味深いものとして私たちの玄関口に登場するのは時間の問題でした」と彼は言いました。 ピーターサルナック、高等研究所およびプリンストン大学の数学者。当初、新たに発見されたパターンがなぜ存在するのか誰も説明できませんでした。それ以来、数学者たちは一連の最近の論文で、ムクドリの群れの流動的な形状に似ていることから「つぶやき」と呼ばれるパターンの背後にある理由を解き明かし始め、それらが特定の場所だけで発生するわけではないことを証明し始めた。例は 2022 年に検討されましたが、より一般的な楕円曲線でのものです。

楕円形であることの重要性

それらのパターンが何であるかを理解するには、楕円曲線とは何か、そして数学者が楕円曲線をどのように分類するかについて少し基礎を築く必要があります。

楕円曲線は 1 つの変数の 2 乗に関係し、一般に次のように書かれます。 y、別の 3 乗、一般的に次のように書かれます。 x: y2 = x3 + Ax + B、ある数値のペアに対して A & B限り、 A & B いくつかの簡単な条件を満たします。この方程式は、以下に示すように、平面上にグラフ化できる曲線を定義します。 (名前は似ていますが、楕円は楕円曲線ではありません。)

概要

見た目は単純ですが、楕円曲線は整数のパターンを探す数学者である数論者にとって非常に強力なツールであることが判明しました。変数を持たせる代わりに x & y 数学者は、それらをさまざまな数体系に制限することを好みます。これを、特定の数体系の「上に」曲線を定義すると呼びます。有理数 (分数として記述できる数値) に限定された楕円曲線は、特に便利です。 「実数や複素数に対する楕円曲線は非常に退屈です」とサーナク氏は言います。 「有理数だけが深いのです。」

これが真実である 1 つの方法です。楕円曲線上の 2 つの有理点の間に直線を引くと、その線が再び曲線と交差する場所も有理点になります。この事実を利用して、以下に示すように、楕円曲線での「加算」を定義できます。

概要

間に線を引きます P & Q。その線は 3 番目の点で曲線と交差します。 R。 (数学者は、「無限遠点」を追加することで、線が曲線と交わらない場合に対処するための特別なトリックを持っています。) R 越えて x-axis は合計です P + Q。この加算演算とともに、曲線のすべての解はグループと呼ばれる数学的オブジェクトを形成します。

数学者はこれを使用して曲線の「ランク」を定義します。の 曲線のランク 持つ合理的な解決策の数に関係します。ランク 0 曲線には有限数の解があります。より高いランクの曲線には無限の数の解があり、加算演算を使用した相互の関係はランクによって記述されます。

ランクはよく理解されていません。数学者はそれらを計算する方法を常に持っているわけではなく、それらがどれだけ大きくなるかわかりません。 (特定の曲線について知られている最大の正確なランクは 20 です。) 見た目が似ている曲線でも、ランクがまったく異なる場合があります。

楕円曲線は、1 とそれ自体でしか割り切れない素数とも大きく関係しています。特に、数学者は有限体上の曲線、つまり素数ごとに定義された循環演算システムに注目します。有限体は、素数に等しい時間数を持つ時計のようなものです。上に数え続けると、数値は再び始まります。たとえば、7 の有限体では、5 プラス 2 は 5 に等しく、3 プラス 1 は XNUMX に等しくなります。

概要

楕円曲線には、と呼ばれる一連の数値が関連付けられています。 ap、素数によって定義される有限体の曲線に存在する解の数に関係します。 p。 小さい ap より多くのソリューションを意味します。より大きな ap つまり、解決策が少なくなります。順位を計算するのは難しいですが、順序は ap はるかに簡単です。

バーチとスウィナートン・ダイアーは、最初のコンピューターの 1 つで行われた多数の計算に基づいて、楕円曲線のランクと数列の関係を推測しました。 ap。自分たちが正しかったことを証明できた人は誰でも、100万ドルと数学的不死を獲得できる立場にあります。

意外なパターンが出現

パンデミックが始まってから、 ヤン・フイ・ヘロンドン数理科学研究所の研究者は、いくつかの新しい挑戦を決意しました。彼は大学で物理学を専攻し、マサチューセッツ工科大学で数理物理学の博士号を取得していました。しかし、彼は数論にますます興味を持ち、人工知能の能力が向上していることを考慮して、数値の予期せぬパターンを見つけるためのツールとして AI を使用してみようと考えました。 (彼はすでにそうでした 機械学習を使用する 分類する カラビ・ヤウ多様体、弦理論で広く使用されている数学的構造。)

概要

2020年XNUMX月、パンデミックが深刻化する中、ノッティンガム大学は彼を主催して、 オンライントーク。彼は自分の進歩について、そして機械学習を使用して新しい数学を発見する可能性について悲観的でした。 「彼の話は、整数論では物事を機械学習できないため、整数論は難しいというものでした」と述べた。 トーマス・オリバー、聴衆にいたウェストミンスター大学の数学者。彼はこう回想しています。私はこれを見るために正しいものを使っていませんでした。」

オリバーと イ・ギュファンコネチカット大学の数学者である彼は、彼と協力し始めました。 「数学を真剣に勉強するためではなく、機械学習とは何かを学ぶためだけにこれを行うことにしました」とオリバー氏は語った。 「しかし、多くのことを機械学習できることがすぐにわかりました。」

オリバーとリーは、自分のテクニックを応用して検査するよう提案しました。 L-関数、シーケンスを通じて楕円曲線に密接に関連する無限級数 ap。楕円曲線とそれに関連するオンライン データベースを使用することもできます。 L- と呼ばれる関数 LMFDB 機械学習分類器をトレーニングするためです。当時、データベースには有理数を超える楕円曲線が 3 万を少し超えるものがありました。 2020 年 XNUMX 月までに、 ~から収集した情報を使用した L-楕円曲線の特定の特性を予測する関数。 11月に彼らは共有しました 別の紙 それは機械学習を使用して他のオブジェクトを数論で分類しました。 12月までに彼らはできるようになった 楕円曲線の順位を予測する 高い精度で。

しかし、彼らはなぜ機械学習アルゴリズムがこれほどうまく機能するのかわかりませんでした。リーさんは学部生のアレクセイ・ポズドニャコフさんに、何が起こっているのか解明できるかどうか尋ねた。偶然にも、LMFDB は、曲線が適切に動作しない素数に関する情報を要約する導体と呼ばれる量に従って楕円曲線を分類します。そこでポズドニャコフは、同様の導体を使用した多数の曲線を同時に調べてみました。たとえば、7,500 ~ 10,000 個の導体を使用したすべての曲線を調べました。

概要

これは合計約 10,000 の曲線に相当します。これらの約半分はランク 0 で、半分はランク 1 でした。(これより高いランクは非常にまれです)。その後、彼は次の値を平均しました。 ap すべてのランク 0 曲線について個別に平均化 ap すべてのランク 1 曲線について計算し、結果をプロットしました。 XNUMX つのドットのセットは、XNUMX つの異なる、容易に識別できる波を形成しました。これが、機械学習分類器が特定の曲線のランクを正確に確認できた理由です。

「最初は、任務を完了できたことにただ満足していました」とポズドニャコフさんは語った。 「しかし、キュファンはこのパターンが驚くべきものであることにすぐに気づき、それが本当にエキサイティングになったときです。」

リーとオリバーはすっかり魅了されました。 「アレクセイが私たちに写真を見せてくれたので、鳥がやることのように見えると言いました」とオリバーさんは語った。 「そしてキュファンはそれを調べて、それはつぶやきと呼ばれるものだと言いました、そしてヤンは新聞に電話するべきだと言いました」楕円曲線のつぶやき

彼らは2022年XNUMX月に論文をアップロードし、それを他の数人の数学者に転送し、彼らのいわゆる「発見」がよく知られていると言われることを期待して緊張した。オリバーは、この関係はあまりにも目に見えていたので、ずっと前に気づいていたはずだと語った。

概要

ほぼ即座に、このプレプリントは特に以下の人々からの関心を集めました。 アンドリューサザーランド、MIT の研究科学者であり、LMFDB の編集長の 3 人です。サザーランドは、150 万個の楕円曲線では目的を達成するには十分ではないことに気づきました。彼は、より広い導体の範囲を調べて、雑音の強さを確認したいと考えていました。彼は、約 300 億 XNUMX 万個の楕円曲線が含まれる別の巨大なリポジトリからデータを引き出しました。それでも満足できなかった彼は、別のリポジトリから XNUMX 億のカーブを含むデータを取得しました。

「しかし、それだけでは十分ではなかったので、実際に 15,000 億を超える楕円曲線からなる新しいデータセットを計算しました。それを使って本当に高解像度の写真を計算しました」とサザーランド氏は語った。つぶやきは、平均して一度に XNUMX 個以上の楕円曲線を作成した場合でも、一度に XNUMX 万個以上の楕円曲線を作成した場合でも現れました。素数がどんどん大きくなるにつれて曲線を観察しても、形状は同じままでした。これはスケール不変性と呼ばれる現象です。サザーランドはまた、雑音は楕円曲線に特有のものではなく、より一般的なものにも現れることにも気づきました。 L-機能。彼が書きました 彼の発見を要約した手紙 そしてそれをサルナクに送りました マイケル・ルビンスタイン ウォータールー大学で。

「それについて既知の説明があるのなら、あなたもそれを知っていると思います」とサザーランド氏は書いた。

彼らはしませんでした。

パターンの説明

Lee、He、Oliver は、2023 年 XNUMX 月にブラウン大学の数学実験実験研究所 (ICERM) でつぶやきに関するワークショップを開催しました。サルナクとルービンシュタイン、そしてサルナクの生徒も来ました ニーナ・ズブリリナ.

Zubrilina は、雑音パターンに関する研究を発表しました。 モジュール形式、楕円曲線のように、関連する特別な複雑な関数 L-機能。大きな導体を備えたモジュール形式では、つぶやきは、認識できるが分散したパターンを形成するのではなく、明確に定義された曲線に収束します。で 11 年 2023 月 XNUMX 日に投稿されたズブリリナさんは、この種のつぶやきが彼女が発見した明確な公式に従っていることを証明しました。

「ニーナの大きな功績は、彼女がこれのための公式を与えたことです。私はこれをズブリリナの雑音密度公式と呼んでいます」とサルナク氏は語った。 「非常に洗練された数学を使用して、彼女はデータに完全に適合する正確な公式を証明しました。」

彼女の公式は複雑だが、サルナク氏はこれを、光学から量子力学に至るまで、物理学のさまざまな文脈で使用される微分方程式の解を定義するエアリー関数に匹敵する、重要な新しい種類の関数であると歓迎している。

Zubrilina の処方が最初のものでしたが、他の処方も追随しました。 「現在、毎週新しい論文が発表されています」とサルナク氏は言う。「主にズブリリナのツールを使用して、雑音の他の側面を説明しています。」

ジョナサン・ボーバー, アンドリュー・ブッカー & ミン・リー ブリストル大学の デビッド・ローリー・ドゥーダ ICERM の研究により、モジュール形式で異なるタイプの雑音の存在が証明されました。 別の10月の新聞。そしてリー・キュファン、オリバー、ポズドニャコフ 存在を証明した と密接に関連するディリクレ文字と呼ばれるオブジェクト内のつぶやきの L-関数。

サザーランド氏は、雑音の発見につながった大きな幸運に感銘を受けた。楕円曲線データが指揮者によってオーダーされていなかったら、雑音は消えていたでしょう。 「幸運なことに、彼らはLMFDBからデータを取得していました。データは指揮者に従って事前に分類されていました」と彼は言いました。 「それは楕円曲線を対応するモジュラー形式に関連付けるものですが、それはまったく明らかではありません。 …方程式が非常に似ている 2 つの曲線は、非常に異なる導体を持つ可能性があります。」たとえば、サザーランド氏は次のように述べています。 y2 = x3 - 11x + 6 には導体 17 がありますが、マイナス記号をプラス記号に反転すると、 y2 = x3 + 11x + 6 には導体 100,736 があります。

それでも、ポズドニャコフの経験不足のせいで、つぶやきが発見されただけだった。 「彼なしでは発見できなかったと思います」とオリバー氏は語った。 ap 絶対値は 1 になります。しかし、彼はそれらを正規化しませんでした…そのため、振動は非常に大きく、目に見えました。」

AI アルゴリズムが楕円曲線をランク別に分類するために使用する統計パターンは、数百次元のパラメータ空間に存在します。その次元が多すぎて、人間が視覚化することはおろか、頭の中で分類することもできないとオリバー氏は指摘します。しかし、機械学習は隠れた振動を発見しましたが、「それが雑音であることを理解したのは後になってからです」。

編集者注: Andrew Sutherland、Kyu-Hwan Lee、および L-Function および Modular Forms データベース (LMFDB) はすべて、この編集上独立した出版物にも資金提供している Simons Foundation から資金提供を受けています。サイモンズ財団の資金提供に関する決定は、当社の報道内容には影響しません。さらに詳しい情報が入手可能です こちら.

スポット画像

最新のインテリジェンス

スポット画像