Zephyrnet-Logo

Elliptische Kurven-„Gemurmel“ mit KI gefunden, nehmen Flug | Quanta-Magazin

Datum:

Einleitung

Elliptische Kurven gehören zu den verlockenderen Objekten der modernen Mathematik. Sie scheinen nicht kompliziert zu sein, aber sie bilden eine Schnellstraße zwischen der Mathematik, die viele Menschen in der High School lernen, und der forschenden Mathematik in ihrer abstrusesten Form. Sie waren von zentraler Bedeutung für Andrew Wiles‘ berühmten Beweis von Fermats letztem Satz in den 1990er Jahren. Sie sind Schlüsselwerkzeuge der modernen Kryptographie. Und im Jahr 2000 ernannte das Clay Mathematics Institute einen Vermutung über die Statistik von elliptischen Kurven eines von sieben „Millennium-Preis-Problemen“, von denen jedes für seine Lösung mit einem Preisgeld von 1 Million US-Dollar dotiert ist. Diese Vermutung wurde zuerst von gewagt Bryan Birke und Peter Swinnerton-Dyer in den 1960er Jahren, ist immer noch nicht bewiesen.

Das Verständnis elliptischer Kurven ist ein risikoreiches Unterfangen, das für die Mathematik von zentraler Bedeutung ist. Als im Jahr 2022 eine transatlantische Zusammenarbeit mithilfe statistischer Techniken und künstlicher Intelligenz völlig unerwartete Muster in elliptischen Kurven entdeckte, war dies ein willkommener, wenn auch unerwarteter Beitrag. „Es war nur eine Frage der Zeit, bis maschinelles Lernen mit etwas Interessantem vor unserer Haustür landete“, sagte er Peter Sarak, Mathematiker am Institute for Advanced Study und der Princeton University. Warum es die neu entdeckten Muster gibt, konnte zunächst niemand erklären. Seitdem haben Mathematiker in einer Reihe neuerer Arbeiten damit begonnen, die Gründe für die Muster zu entschlüsseln, die wegen ihrer Ähnlichkeit mit den fließenden Formen schwärmender Stare „Murmurationen“ genannt werden, und haben begonnen zu beweisen, dass sie nicht nur im Einzelnen auftreten müssen Beispiele im Jahr 2022 untersucht, jedoch allgemeiner in elliptischen Kurven.

Die Bedeutung der Elliptik

Um zu verstehen, was diese Muster sind, müssen wir ein wenig Grundlagen darüber legen, was elliptische Kurven sind und wie Mathematiker sie kategorisieren.

Eine elliptische Kurve stellt das Quadrat einer Variablen in Beziehung, üblicherweise geschrieben als y, zur dritten Potenz eines anderen, üblicherweise geschrieben als x: y2 = x3 + Ax + B, für ein Zahlenpaar A und BSolange A und B einige einfache Bedingungen erfüllen. Diese Gleichung definiert eine Kurve, die auf der Ebene grafisch dargestellt werden kann, wie unten gezeigt. (Trotz der Ähnlichkeit der Namen ist eine Ellipse keine elliptische Kurve.)

Einleitung

Obwohl sie schlicht aussehen, erweisen sich elliptische Kurven als unglaublich leistungsfähige Werkzeuge für Zahlentheoretiker – Mathematiker, die nach Mustern in den ganzen Zahlen suchen. Anstatt die Variablen zuzulassen x und y Da sie sich über alle Zahlen erstrecken, beschränken Mathematiker sie gerne auf verschiedene Zahlensysteme, was sie als Definition einer Kurve „über“ einem bestimmten Zahlensystem bezeichnen. Besonders nützlich sind elliptische Kurven, die auf rationale Zahlen beschränkt sind – Zahlen, die als Brüche geschrieben werden können. „Elliptische Kurven über reellen oder komplexen Zahlen sind ziemlich langweilig“, sagte Sarnak. „Nur die rationalen Zahlen sind tief.“

Hier ist eine Möglichkeit, die wahr ist. Wenn Sie eine gerade Linie zwischen zwei rationalen Punkten auf einer elliptischen Kurve zeichnen, ist auch die Stelle, an der diese Linie die Kurve erneut schneidet, rational. Sie können diese Tatsache nutzen, um „Addition“ in einer elliptischen Kurve zu definieren, wie unten gezeigt.

Einleitung

Ziehen Sie eine Linie dazwischen P und Q. Diese Linie schneidet die Kurve an einem dritten Punkt. R. (Mathematiker haben einen besonderen Trick für den Fall, dass die Linie die Kurve nicht schneidet, indem sie einen „Punkt im Unendlichen“ hinzufügen.) Die Spiegelung von R über den x-Achse ist Ihre Summe P + Q. Zusammen mit dieser Additionsoperation bilden alle Lösungen der Kurve ein mathematisches Objekt, das als Gruppe bezeichnet wird.

Mathematiker verwenden dies, um den „Rang“ einer Kurve zu definieren. Der Rang einer Kurve bezieht sich auf die Anzahl der rationalen Lösungen, die es hat. Kurven vom Rang 0 haben eine endliche Anzahl von Lösungen. Kurven mit höherem Rang haben unendlich viele Lösungen, deren Beziehung zueinander durch die Additionsoperation durch den Rang beschrieben wird.

Ränge sind nicht gut verstanden; Mathematiker haben nicht immer die Möglichkeit, sie zu berechnen, und wissen nicht, wie groß sie werden können. (Der größte genaue Rang, der für eine bestimmte Kurve bekannt ist, ist 20.) Ähnlich aussehende Kurven können völlig unterschiedliche Ränge haben.

Elliptische Kurven haben auch viel mit Primzahlen zu tun, die nur durch 1 und sich selbst teilbar sind. Mathematiker betrachten insbesondere Kurven über endlichen Körpern – Systeme der zyklischen Arithmetik, die für jede Primzahl definiert sind. Ein endliches Feld ist wie eine Uhr, deren Stundenzahl der Primzahl entspricht: Wenn man weiter aufwärts zählt, beginnen die Zahlen von vorne. Im endlichen Körper für 7 ist beispielsweise 5 plus 2 gleich Null und 5 plus 3 gleich 1.

Einleitung

Einer elliptischen Kurve ist eine Folge von Zahlen zugeordnet, genannt ap, die sich auf die Anzahl der Lösungen bezieht, die es für die Kurve im durch die Primzahl definierten endlichen Körper gibt p. Ein kleiner ap bedeutet mehr Lösungen; ein größerer ap bedeutet weniger Lösungen. Obwohl der Rang schwer zu berechnen ist, ist die Reihenfolge schwierig ap ist viel einfacher.

Auf der Grundlage zahlreicher Berechnungen, die auf einem der allerersten Computer durchgeführt wurden, vermuteten Birch und Swinnerton-Dyer einen Zusammenhang zwischen dem Rang einer elliptischen Kurve und der Folge ap. Wer beweisen kann, dass er Recht hatte, kann eine Million Dollar und mathematische Unsterblichkeit gewinnen.

Es entsteht ein überraschendes Muster

Nach Beginn der Pandemie Yang-Hui He, ein Forscher am London Institute for Mathematical Sciences, beschloss, sich neuen Herausforderungen zu stellen. Er hatte am College Physik studiert und am Massachusetts Institute of Technology in mathematischer Physik promoviert. Aber er interessierte sich zunehmend für die Zahlentheorie und angesichts der zunehmenden Möglichkeiten der künstlichen Intelligenz dachte er, er würde versuchen, KI als Werkzeug zum Auffinden unerwarteter Muster in Zahlen einzusetzen. (Das war er bereits mit maschinellem Lernen klassifizieren Calabi-Yau-Mannigfaltigkeiten, mathematische Strukturen, die in der Stringtheorie weit verbreitet sind.)

Einleitung

Im August 2020, als sich die Pandemie verschärfte, empfing ihn die University of Nottingham für eine Woche Online-Gespräch. Er war pessimistisch hinsichtlich seiner Fortschritte und hinsichtlich der Möglichkeit, maschinelles Lernen zu nutzen, um neue Mathematik zu entdecken. „Seine Erzählung war, dass die Zahlentheorie schwierig sei, weil man in der Zahlentheorie Dinge nicht maschinell lernen könne“, sagte er Thomas Oliver, ein Mathematiker an der University of Westminster, der im Publikum war. Er erinnert sich: „Ich konnte nichts finden, weil ich kein Experte war. Ich habe nicht einmal die richtigen Dinge verwendet, um mir das anzuschauen.“

Oliver und Kyu-Hwan Lee, ein Mathematiker an der University of Connecticut, begann mit He zu arbeiten. „Wir haben uns entschieden, dies nur zu tun, um zu lernen, was maschinelles Lernen ist, und nicht, um uns ernsthaft mit Mathematik zu beschäftigen“, sagte Oliver. „Aber wir haben schnell herausgefunden, dass man viele Dinge maschinell lernen kann.“

Oliver und Lee schlugen ihm vor, seine Untersuchungstechniken anzuwenden L-Funktionen, unendliche Reihen, die eng mit elliptischen Kurven durch die Folge verbunden sind ap. Sie könnten eine Online-Datenbank mit elliptischen Kurven und den damit verbundenen Kurven nutzen L-Funktionen namens LMFDB um ihre Klassifikatoren für maschinelles Lernen zu trainieren. Zu diesem Zeitpunkt enthielt die Datenbank etwas mehr als 3 Millionen elliptische Kurven über den rationalen Zahlen. Bis Oktober 2020 hatten sie es geschafft ein Papier das verwendete Informationen aus L-Funktionen zur Vorhersage einer bestimmten Eigenschaft elliptischer Kurven. Im November teilten sie sich ein weiteres Papier das maschinelles Lernen nutzte, um andere Objekte in der Zahlentheorie zu klassifizieren. Im Dezember gelang es ihnen Sagen Sie die Ränge elliptischer Kurven voraus mit hoher Genauigkeit.

Sie waren sich jedoch nicht sicher, warum ihre Algorithmen für maschinelles Lernen so gut funktionierten. Lee bat seinen Studenten Alexey Pozdnyakov, herauszufinden, was los sei. Tatsächlich sortiert die LMFDB elliptische Kurven nach einer Größe namens „Leiter“, die Informationen über Primzahlen zusammenfasst, für die sich eine Kurve nicht gut verhält. Also versuchte Pozdnyakov, eine große Anzahl von Kurven mit ähnlichen Leitern gleichzeitig zu betrachten – sagen wir alle Kurven mit Leitern zwischen 7,500 und 10,000.

Einleitung

Insgesamt waren es etwa 10,000 Kurven. Ungefähr die Hälfte davon hatte den Rang 0 und die andere Hälfte den Rang 1. (Höhere Ränge sind äußerst selten.) Anschließend ermittelte er den Durchschnitt der Werte von ap für alle Rang-0-Kurven, separat gemittelt ap für alle Rang-1-Kurven und zeichnete die Ergebnisse auf. Die beiden Punktgruppen bildeten zwei deutliche, leicht erkennbare Wellen. Aus diesem Grund konnten die Klassifikatoren des maschinellen Lernens die Ränge bestimmter Kurven korrekt ermitteln.

„Zuerst war ich einfach froh, dass ich den Auftrag erfüllt hatte“, sagte Pozdnyakov. „Aber Kyu-Hwan erkannte sofort, dass dieses Muster überraschend war, und da wurde es richtig spannend.“

Lee und Oliver waren begeistert. „Alexey hat uns das Bild gezeigt und ich sagte, es sieht aus wie das, was Vögel tun“, sagte Oliver. „Und dann hat Kyu-Hwan nachgeschlagen und gesagt, dass man es Murmeln nennt, und dann hat Yang gesagt, wir sollten die Zeitung ‚‘‘ nennen.Murmeln elliptischer Kurven. '""

Sie luden ihre Arbeit im April 2022 hoch und leiteten sie an eine Handvoll anderer Mathematiker weiter, in der nervösen Erwartung, dass ihnen mitgeteilt würde, dass ihre sogenannte „Entdeckung“ allgemein bekannt sei. Oliver sagte, dass die Beziehung so sichtbar sei, dass sie schon vor langer Zeit hätte bemerkt werden müssen.

Einleitung

Fast sofort stieß der Vorabdruck auf Interesse, insbesondere bei Andreas Sutherland, ein Forschungswissenschaftler am MIT, der einer der geschäftsführenden Herausgeber der LMFDB ist. Sutherland erkannte, dass 3 Millionen elliptische Kurven für seine Zwecke nicht ausreichten. Er wollte sich viel größere Leiterbereiche ansehen, um zu sehen, wie robust die Geräusche waren. Er bezog Daten aus einem anderen riesigen Archiv mit etwa 150 Millionen elliptischen Kurven. Noch immer unzufrieden, holte er dann Daten aus einem anderen Repository mit 300 Millionen Kurven.

„Aber selbst das war nicht genug, also habe ich tatsächlich einen neuen Datensatz mit über einer Milliarde elliptischen Kurven berechnet, und diesen habe ich zur Berechnung der wirklich hochauflösenden Bilder verwendet“, sagte Sutherland. Das Gemurmel zeigte, ob er über 15,000 elliptische Kurven auf einmal oder eine Million auf einmal gemittelt hatte. Die Form blieb gleich, selbst als er die Kurven über immer größeren Primzahlen betrachtete, ein Phänomen, das Skaleninvarianz genannt wird. Sutherland erkannte auch, dass Geräusche nicht nur bei elliptischen Kurven auftreten, sondern auch allgemeiner auftreten L-Funktionen. Er schrieb ein Brief, in dem er seine Erkenntnisse zusammenfasst und schickte es nach Sarnak und Michael Rubinstein an der University of Waterloo.

„Wenn es eine bekannte Erklärung dafür gibt, erwarte ich, dass Sie sie kennen“, schrieb Sutherland.

Sie haben es nicht getan.

Erklären des Musters

Lee, He und Oliver organisierten im August 2023 einen Workshop zum Thema Murmeln am Institute for Computational and Experimental Research in Mathematics (ICERM) der Brown University. Sarnak und Rubinstein kamen, ebenso wie Sarnaks Schüler Nina Zubrilina.

Zubrilina stellte ihre Forschungen zu Murmelmustern vor modulare Formen, spezielle komplexe Funktionen, die wie elliptische Kurven verbunden sind L-Funktionen. Bei modularen Formen mit großen Leitern laufen die Geräusche zu einer scharf definierten Kurve zusammen, anstatt ein erkennbares, aber verstreutes Muster zu bilden. In ein Papier Gepostet am 11. Oktober 2023, bewies Zubrilina, dass diese Art des Gemurmels einer expliziten Formel folgt, die sie entdeckt hat.

„Ninas große Leistung besteht darin, dass ihr dafür eine Formel gegeben wurde; Ich nenne es die Zubrilina-Murmurationsdichteformel“, sagte Sarnak. „Mit Hilfe sehr anspruchsvoller Mathematik hat sie eine exakte Formel bewiesen, die perfekt zu den Daten passt.“

Ihre Formel ist kompliziert, aber Sarnak begrüßt sie als eine wichtige neue Art von Funktion, vergleichbar mit den Airy-Funktionen, die Lösungen für Differentialgleichungen definieren, die in verschiedenen Kontexten der Physik verwendet werden, von der Optik bis zur Quantenmechanik.

Obwohl Zubrilinas Formel die erste war, folgten andere. „Jetzt erscheint jede Woche ein neues Papier“, sagte Sarnak, „das hauptsächlich Zubrilinas Werkzeuge verwendet und andere Aspekte des Gemurmels erklärt.“

Jonathan Bober, Andre Booker und Min lee der University of Bristol, zusammen mit David Lowry-Duda von ICERM, bewies die Existenz einer anderen Art von Murmuration in modularen Formen in eine weitere Oktoberzeitung. Und Kyu-Hwan Lee, Oliver und Pozdnyakov bewies die Existenz von Murmeln in Objekten namens Dirichlet-Zeichen, die eng damit verwandt sind L-Funktionen.

Sutherland war beeindruckt von der großen Portion Glück, die zur Entdeckung der Murmeltiere geführt hatte. Wenn die Daten der elliptischen Kurve nicht nach dem Dirigenten geordnet worden wären, wäre das Murmeln verschwunden. „Sie hatten das Glück, Daten aus der LMFDB zu beziehen, die vorsortiert nach dem Dirigenten kamen“, sagte er. „Es ist das, was eine elliptische Kurve mit der entsprechenden modularen Form verbindet, aber das ist überhaupt nicht offensichtlich. … Zwei Kurven, deren Gleichungen sehr ähnlich aussehen, können sehr unterschiedliche Leiter haben.“ Sutherland hat das zum Beispiel bemerkt y2 = x3 - 11x + 6 hat Leiter 17, aber das Minuszeichen wird in ein Pluszeichen umgewandelt, y2 = x3 + 11x + 6 hat den Leiter 100,736.

Schon damals wurden die Gemurmel nur aufgrund der Unerfahrenheit Pozdnyakovs gefunden. „Ich glaube nicht, dass wir es ohne ihn gefunden hätten“, sagte Oliver, „weil die Experten traditionell normalisieren ap den absoluten Wert 1 zu haben. Aber er hat sie nicht normalisiert … also waren die Schwankungen sehr groß und sichtbar.“

Die statistischen Muster, die KI-Algorithmen verwenden, um elliptische Kurven nach Rang zu sortieren, existieren in einem Parameterraum mit Hunderten von Dimensionen – zu viele, als dass Menschen sie im Kopf durchgehen oder gar visualisieren könnten, bemerkte Oliver. Aber obwohl maschinelles Lernen die verborgenen Schwingungen entdeckte, „verstanden wir erst später, dass es sich dabei um das Gemurmel handelte“.

Anmerkung des Herausgebers: Andrew Sutherland, Kyu-Hwan Lee und die L-Functions and Modular Forms Database (LMFDB) wurden alle von der Simons Foundation gefördert, die auch diese redaktionell unabhängige Veröffentlichung finanziert. Finanzierungsentscheidungen der Simons Foundation haben keinen Einfluss auf unsere Berichterstattung. Weitere Informationen sind verfügbar hier.

spot_img

Neueste Intelligenz

spot_img