Logo Zéphyrnet

Des « murmurations » de courbe elliptique découvertes grâce à l'IA Take Flight | Magazine Quanta

Date :

Introduction

Les courbes elliptiques font partie des objets les plus séduisants des mathématiques modernes. Ils ne semblent pas compliqués, mais ils forment une voie express entre les mathématiques que beaucoup de gens apprennent au lycée et les mathématiques de recherche dans leur forme la plus abstruse. Ils étaient au cœur de la célèbre preuve du dernier théorème de Fermat réalisée par Andrew Wiles dans les années 1990. Ce sont des outils clés de la cryptographie moderne. Et en 2000, le Clay Mathematics Institute a nommé un conjecture sur les statistiques de courbes elliptiques, l'un des sept « problèmes du prix du millénaire », chacun d'entre eux étant récompensé d'un million de dollars pour sa solution. Cette conjecture, lancée pour la première fois par Bryan Bouleau ainsi que Peter Swinnerton-Dyer dans les années 1960, n'est toujours pas prouvé.

Comprendre les courbes elliptiques est une entreprise aux enjeux élevés qui est au cœur des mathématiques. Ainsi, en 2022, lorsqu’une collaboration transatlantique a utilisé des techniques statistiques et l’intelligence artificielle pour découvrir des modèles complètement inattendus dans les courbes elliptiques, cela a été une contribution bienvenue, bien qu’inattendue. "Ce n'était qu'une question de temps avant que l'apprentissage automatique arrive à notre porte avec quelque chose d'intéressant", a déclaré Pierre Sarnak, mathématicien à l'Institute for Advanced Study et à l'Université de Princeton. Au départ, personne ne pouvait expliquer pourquoi les modèles nouvellement découverts existaient. Depuis lors, dans une série d’articles récents, les mathématiciens ont commencé à élucider les raisons derrière ces modèles, surnommés « murmures » en raison de leur ressemblance avec les formes fluides des étourneaux en troupeaux, et ont commencé à prouver qu’ils ne doivent pas se produire uniquement dans des cas particuliers. exemples examinés en 2022, mais dans les courbes elliptiques plus généralement.

L'importance d'être elliptique

Pour comprendre ces modèles, nous devons jeter les bases de ce que sont les courbes elliptiques et de la façon dont les mathématiciens les catégorisent.

Une courbe elliptique relie le carré d'une variable, communément écrite sous la forme y, à la troisième puissance d'un autre, communément écrit comme x: y2 = x3 + Ax + B, pour une paire de nombres A ainsi que B, Pour autant que A ainsi que B remplir quelques conditions simples. Cette équation définit une courbe qui peut être représentée graphiquement sur le plan, comme indiqué ci-dessous. (Malgré la similitude des noms, une ellipse n'est pas une courbe elliptique.)

Introduction

Bien qu’elles semblent simples, les courbes elliptiques s’avèrent être des outils incroyablement puissants pour les théoriciens des nombres – les mathématiciens qui recherchent des modèles dans les nombres entiers. Au lieu de laisser les variables x ainsi que y s'étendant sur tous les nombres, les mathématiciens aiment les limiter à différents systèmes numériques, ce qu'ils appellent définir une courbe « sur » un système numérique donné. Les courbes elliptiques limitées aux nombres rationnels – nombres qui peuvent être écrits sous forme de fractions – sont particulièrement utiles. "Les courbes elliptiques sur les nombres réels ou complexes sont assez ennuyeuses", a déclaré Sarnak. "Seuls les nombres rationnels sont profonds."

Voici une façon qui est vraie. Si vous tracez une ligne droite entre deux points rationnels sur une courbe elliptique, l’endroit où cette ligne coupe à nouveau la courbe sera également rationnel. Vous pouvez utiliser ce fait pour définir « addition » dans une courbe elliptique, comme indiqué ci-dessous.

Introduction

Tracez une ligne entre P ainsi que Q. Cette ligne coupera la courbe en un troisième point, R. (Les mathématiciens ont une astuce particulière pour traiter le cas où la droite ne coupe pas la courbe en ajoutant un « point à l'infini ».) Le reflet de R à travers x-axis est votre somme P + Q. Avec cette opération d'addition, toutes les solutions de la courbe forment un objet mathématique appelé groupe.

Les mathématiciens l'utilisent pour définir le « rang » d'une courbe. Le rang d'une courbe est lié au nombre de solutions rationnelles dont il dispose. Les courbes de rang 0 ont un nombre fini de solutions. Les courbes de rang supérieur ont un nombre infini de solutions dont la relation les unes avec les autres à l'aide de l'opération d'addition est décrite par le rang.

Les classements ne sont pas bien compris ; les mathématiciens n'ont pas toujours le moyen de les calculer et ne savent pas quelle taille ils peuvent atteindre. (Le plus grand rang exact connu pour une courbe spécifique est 20.) Des courbes d'apparence similaire peuvent avoir des rangs complètement différents.

Les courbes elliptiques ont aussi beaucoup à voir avec les nombres premiers, qui ne sont divisibles que par 1 et par eux-mêmes. En particulier, les mathématiciens examinent les courbes sur des corps finis – des systèmes d’arithmétique cyclique définis pour chaque nombre premier. Un corps fini est comme une horloge dont le nombre d'heures est égal au nombre premier : si vous continuez à compter vers le haut, les nombres recommencent. Dans le corps fini de 7, par exemple, 5 plus 2 est égal à zéro et 5 plus 3 est égal à 1.

Introduction

Une courbe elliptique est associée à une séquence de nombres, appelée ap, qui concerne le nombre de solutions qu'il existe à la courbe dans le corps fini défini par le premier p. Un plus petit ap signifie plus de solutions ; un plus grand ap signifie moins de solutions. Bien que le rang soit difficile à calculer, la séquence ap est beaucoup plus facile.

Sur la base de nombreux calculs effectués sur l'un des tout premiers ordinateurs, Birch et Swinnerton-Dyer ont conjecturé une relation entre le rang d'une courbe elliptique et la séquence ap. Quiconque peut prouver qu’il avait raison gagnera un million de dollars et l’immortalité mathématique.

Un modèle surprise émerge

Après le début de la pandémie, Yang-Hui He, chercheur au London Institute for Mathematical Sciences, a décidé de relever de nouveaux défis. Il avait étudié la physique à l'université et avait obtenu son doctorat en physique mathématique du Massachusetts Institute of Technology. Mais il s'intéressait de plus en plus à la théorie des nombres et, étant donné les capacités croissantes de l'intelligence artificielle, il pensait essayer d'utiliser l'IA comme un outil permettant de trouver des modèles inattendus dans les nombres. (Il avait déjà été en utilisant l'apprentissage automatique classer Collecteurs Calabi-Yau, structures mathématiques largement utilisées en théorie des cordes.)

Introduction

En août 2020, alors que la pandémie s'aggravait, l'Université de Nottingham l'a accueilli pour une discussion en ligne. Il était pessimiste quant à ses progrès et quant à la possibilité même d’utiliser l’apprentissage automatique pour découvrir de nouvelles mathématiques. "Son récit était que la théorie des nombres était difficile parce qu'on ne pouvait pas apprendre automatiquement des choses en théorie des nombres", a déclaré Thomas Olivier, mathématicien de l'Université de Westminster, qui était présent dans le public. Comme il se souvient : « Je n'ai rien trouvé parce que je n'étais pas un expert. Je n’utilisais même pas les bons éléments pour examiner cela.

Olivier et Kyu-Hwan Lee, mathématicien à l'Université du Connecticut, a commencé à travailler avec He. "Nous avons décidé de faire cela simplement pour apprendre ce qu'était l'apprentissage automatique, plutôt que pour étudier sérieusement les mathématiques", a déclaré Oliver. "Mais nous avons rapidement découvert qu'il était possible d'apprendre beaucoup de choses par machine."

Oliver et Lee lui ont suggéré d'appliquer ses techniques pour examiner L-fonctions, séries infinies étroitement liées aux courbes elliptiques à travers la séquence ap. Ils pourraient utiliser une base de données en ligne de courbes elliptiques et de leurs L-des fonctions appelées LMFDB pour former leurs classificateurs d’apprentissage automatique. À l’époque, la base de données contenait un peu plus de 3 millions de courbes elliptiques sur les rationnels. En octobre 2020, ils avaient un document qui a utilisé des informations glanées auprès de L-fonctions pour prédire une propriété particulière des courbes elliptiques. En novembre, ils ont partagé un autre papier qui utilisait l'apprentissage automatique pour classer d'autres objets en théorie des nombres. En décembre, ils ont pu prédire les rangs des courbes elliptiques avec une grande précision.

Mais ils ne savaient pas vraiment pourquoi leurs algorithmes d’apprentissage automatique fonctionnaient si bien. Lee a demandé à son étudiant de premier cycle Alexey Pozdnyakov de voir s'il pouvait comprendre ce qui se passait. En l’occurrence, la LMFDB trie les courbes elliptiques en fonction d’une quantité appelée conducteur, qui résume les informations sur les nombres premiers pour lesquels une courbe ne se comporte pas correctement. Pozdnyakov a donc essayé d’examiner simultanément un grand nombre de courbes comportant des conducteurs similaires – disons toutes les courbes comportant entre 7,500 10,000 et XNUMX XNUMX conducteurs.

Introduction

Cela représente environ 10,000 0 courbes au total. Environ la moitié d’entre eux avaient le rang 1 et l’autre moitié le rang XNUMX. (Les rangs supérieurs sont extrêmement rares.) Il a ensuite fait la moyenne des valeurs de ap pour toutes les courbes de rang 0, moyennées séparément ap pour toutes les courbes de rang 1, et tracé les résultats. Les deux ensembles de points formaient deux vagues distinctes et facilement discernables. C’est pourquoi les classificateurs d’apprentissage automatique ont été capables de déterminer correctement le rang de courbes particulières.

"Au début, j'étais simplement heureux d'avoir terminé ma mission", a déclaré Pozdnyakov. "Mais Kyu-Hwan a immédiatement reconnu que ce schéma était surprenant, et c'est à ce moment-là qu'il est devenu vraiment excitant."

Lee et Oliver étaient captivés. "Alexey nous a montré la photo et j'ai dit qu'elle ressemblait à ce que font les oiseaux", a déclaré Oliver. "Et puis Kyu-Hwan a recherché et a dit que cela s'appelait une murmuration, et puis Yang a dit que nous devrions appeler le journal"Murmures de courbes elliptiques. '"

Ils ont mis en ligne leur article en avril 2022 et l’ont transmis à une poignée d’autres mathématiciens, s’attendant nerveusement à se faire dire que leur soi-disant « découverte » était bien connue. Oliver a déclaré que la relation était si visible qu'elle aurait dû être remarquée depuis longtemps.

Introduction

Presque immédiatement, la prépublication a suscité l'intérêt, notamment de la part de Andrew Sutherland, chercheur scientifique au MIT et l'un des rédacteurs en chef de la LMFDB. Sutherland s'est rendu compte que 3 millions de courbes elliptiques n'étaient pas suffisantes pour atteindre ses objectifs. Il voulait examiner des gammes de conducteurs beaucoup plus larges pour voir à quel point les murmures étaient robustes. Il a extrait des données d’un autre immense référentiel d’environ 150 millions de courbes elliptiques. Toujours insatisfait, il a ensuite extrait les données d'un autre référentiel contenant 300 millions de courbes.

"Mais même cela ne suffisait pas, j'ai donc calculé un nouvel ensemble de données de plus d'un milliard de courbes elliptiques, et c'est ce que j'ai utilisé pour calculer les images à très haute résolution", a déclaré Sutherland. Les murmures indiquaient s'il effectuait en moyenne plus de 15,000 XNUMX courbes elliptiques à la fois ou un million à la fois. La forme est restée la même alors qu’il observait les courbes sur des nombres premiers de plus en plus grands, un phénomène appelé invariance d’échelle. Sutherland s'est également rendu compte que les murmures ne sont pas propres aux courbes elliptiques, mais apparaissent également de manière plus générale. L-les fonctions. Il a écrit une lettre résumant ses conclusions et l'envoya à Sarnak et Michel Rubinstein à l'Université de Waterloo.

"S'il existe une explication connue, j'espère que vous la connaîtrez", a écrit Sutherland.

Ils ne l'ont pas fait.

Expliquer le modèle

Lee, He et Oliver ont organisé un atelier sur les murmurations en août 2023 à l'Institut de recherche informatique et expérimentale en mathématiques (ICERM) de l'Université Brown. Sarnak et Rubinstein sont venus, tout comme l'élève de Sarnak. Nina Zubrilina.

Zubrilina a présenté ses recherches sur les modèles de murmuration dans formes modulaires, fonctions complexes spéciales qui, comme les courbes elliptiques, sont associées L-les fonctions. Dans les formes modulaires dotées de grands conducteurs, les murmurations convergent vers une courbe nettement définie, plutôt que de former un motif perceptible mais dispersé. Dans un document posté le 11 octobre 2023, Zubrilina a prouvé que ce type de murmuration suit une formule explicite qu'elle a découverte.

« La grande réussite de Nina est qu'elle lui a donné une formule pour cela ; Je l’appelle la formule de densité de murmuration Zubrilina », a déclaré Sarnak. "En utilisant des mathématiques très sophistiquées, elle a prouvé une formule exacte qui correspond parfaitement aux données."

Sa formule est compliquée, mais Sarnak la salue comme un nouveau type de fonction important, comparable aux fonctions d'Airy qui définissent des solutions aux équations différentielles utilisées dans divers contextes en physique, allant de l'optique à la mécanique quantique.

Bien que la formule de Zubrilina ait été la première, d'autres ont suivi. "Chaque semaine maintenant, un nouvel article sort", a déclaré Sarnak, "utilisant principalement les outils de Zubrilina, expliquant d'autres aspects des murmurations."

Jonathan Bober, Andrew Booker ainsi que Min Lee de l'Université de Bristol, en collaboration avec David Lowry-Duda de l'ICERM, a prouvé l'existence d'un type différent de murmuration sous des formes modulaires dans un autre article d'octobre. Et Kyu-Hwan Lee, Oliver et Pozdnyakov a prouvé l'existence de murmurations dans des objets appelés personnages de Dirichlet qui sont étroitement liés à L-les fonctions.

Sutherland a été impressionné par la dose considérable de chance qui a conduit à la découverte des murmurations. Si les données de la courbe elliptique n'avaient pas été classées par conducteur, les murmures auraient disparu. "Ils ont eu la chance de récupérer les données de la LMFDB, qui étaient pré-triées selon le chef d'orchestre", a-t-il déclaré. « C'est ce qui relie une courbe elliptique à la forme modulaire correspondante, mais ce n'est pas du tout évident. … Deux courbes dont les équations semblent très similaires peuvent avoir des conducteurs très différents. Par exemple, Sutherland a noté que y2 = x3 au 11 Févrierx + 6 a le conducteur 17, mais en transformant le signe moins en signe plus, y2 = x3 + 11x + 6 a le conducteur 100,736 XNUMX.

Même alors, les murmures n'ont été découverts qu'en raison de l'inexpérience de Pozdniakov. "Je ne pense pas que nous l'aurions trouvé sans lui", a déclaré Oliver, "parce que les experts normalisent traditionnellement ap avoir une valeur absolue de 1. Mais il ne les a pas normalisés… donc les oscillations étaient très importantes et visibles.

Les modèles statistiques que les algorithmes d’IA utilisent pour trier les courbes elliptiques par rang existent dans un espace de paramètres comportant des centaines de dimensions – trop nombreuses pour que les gens puissent les trier dans leur esprit, et encore moins les visualiser, a noté Oliver. Mais même si l’apprentissage automatique a découvert les oscillations cachées, « ce n’est que plus tard que nous avons compris qu’il s’agissait de murmures ».

Note de l'éditeur : Andrew Sutherland, Kyu-Hwan Lee et la base de données des fonctions L et des formulaires modulaires (LMFDB) ont tous reçu un financement de la Fondation Simons, qui finance également cette publication éditorialement indépendante. Les décisions de financement de la Fondation Simons n’ont aucune influence sur notre couverture. Plus d'informations sont disponibles ici.

spot_img

Dernières informations

spot_img