Zephyrnet-logo

Elliptische curve 'murmuraties' gevonden met AI op de vlucht | Quanta-tijdschrift

Datum:

Introductie

Elliptische krommen behoren tot de meest verleidelijke objecten in de moderne wiskunde. Ze lijken niet ingewikkeld, maar vormen een snelweg tussen de wiskunde die veel mensen op de middelbare school leren en de meest duistere wiskunde in onderzoek. Ze stonden centraal in het gevierde bewijs van de laatste stelling van Fermat door Andrew Wiles in de jaren negentig. Het zijn sleutelinstrumenten in de moderne cryptografie. En in 1990 noemde het Clay Mathematics Institute een vermoedens over de statistieken van elliptische krommen, een van de zeven ‘Millenniumprijsproblemen’, die elk een prijs van $ 1 miljoen met zich meebrengen voor de oplossing ervan. Dat vermoeden werd voor het eerst gewaagd door Bryan Berk en Peter Swinnerton-Dyer in de jaren zestig, is nog steeds niet bewezen.

Het begrijpen van elliptische krommen is een onderneming waarbij veel op het spel staat en die centraal staat in de wiskunde. Dus toen een transatlantische samenwerking in 2022 statistische technieken en kunstmatige intelligentie gebruikte om totaal onverwachte patronen in elliptische curven te ontdekken, was dit een welkome, zij het onverwachte, bijdrage. “Het was slechts een kwestie van tijd voordat machine learning met iets interessants bij ons op de stoep belandde”, zegt hij Peter Sarnak, een wiskundige aan het Institute for Advanced Study en Princeton University. Aanvankelijk kon niemand verklaren waarom de nieuw ontdekte patronen bestaan. Sindsdien zijn wiskundigen in een reeks recente artikelen begonnen met het ontrafelen van de redenen achter de patronen, die ‘murmuraties’ worden genoemd vanwege hun gelijkenis met de vloeiende vormen van massale spreeuwen, en zijn ze begonnen te bewijzen dat ze niet alleen in het specifieke geval moeten voorkomen. voorbeelden onderzocht in 2022, maar meer in het algemeen in elliptische curven.

Het belang van elliptisch zijn

Om te begrijpen wat die patronen zijn, moeten we wat basiswerk leggen over wat elliptische curven zijn en hoe wiskundigen ze categoriseren.

Een elliptische curve relateert het kwadraat van één variabele, gewoonlijk geschreven als y, tot de derde macht van een ander, gewoonlijk geschreven als x: y2 = x3 + Ax + B, voor een paar getallen A en B, Zolang A en B aan een paar duidelijke voorwaarden voldoen. Deze vergelijking definieert een curve die in het vlak kan worden weergegeven, zoals hieronder weergegeven. (Ondanks de gelijkenis in de namen is een ellips geen elliptische curve.)

Introductie

Hoewel ze er eenvoudig uitzien, blijken elliptische krommen ongelooflijk krachtige hulpmiddelen te zijn voor getaltheoretici: wiskundigen die op zoek zijn naar patronen in de gehele getallen. In plaats van de variabelen toe te laten x en y bereik over alle getallen, beperken wiskundigen ze graag tot verschillende getalsystemen, die ze het definiëren van een curve ‘over’ een bepaald getalsysteem noemen. Elliptische curven die beperkt zijn tot de rationale getallen – getallen die als breuken kunnen worden geschreven – zijn bijzonder nuttig. "Elliptische curven over de reële of complexe getallen zijn behoorlijk saai", zei Sarnak. “Alleen de rationale getallen zijn diep.”

Hier is één manier waarop dat waar is. Als je een rechte lijn trekt tussen twee rationele punten op een elliptische curve, zal de plaats waar die lijn de curve opnieuw snijdt ook rationeel zijn. U kunt dat feit gebruiken om ‘optelling’ in een elliptische curve te definiëren, zoals hieronder weergegeven.

Introductie

Trek een lijn ertussen P en Q. Die lijn zal de curve op een derde punt snijden, R. (Wiskundigen hebben een speciale truc om om te gaan met het geval waarin de lijn de curve niet snijdt door een ‘punt op oneindig’ toe te voegen.) De weerspiegeling van R over de x-as is uw som P + Q. Samen met deze optelling vormen alle oplossingen van de curve een wiskundig object dat een groep wordt genoemd.

Wiskundigen gebruiken dit om de “rang” van een curve te definiëren. De rang van een curve heeft betrekking op het aantal rationele oplossingen dat het heeft. Rang 0-curven hebben een eindig aantal oplossingen. Curven met een hogere rangorde hebben een oneindig aantal oplossingen waarvan de relatie tot elkaar met behulp van de optelbewerking wordt beschreven door de rangorde.

Rangen worden niet goed begrepen; wiskundigen hebben niet altijd een manier om ze te berekenen en weten niet hoe groot ze kunnen worden. (De grootste exacte rang die bekend is voor een specifieke curve is 20.) Op elkaar lijkende curven kunnen totaal verschillende rangen hebben.

Elliptische krommen hebben ook veel te maken met priemgetallen, die alleen deelbaar zijn door 1 en zichzelf. Wiskundigen kijken vooral naar krommen over eindige velden – systemen van cyclische rekenkunde die voor elk priemgetal worden gedefinieerd. Een eindig veld is als een klok waarvan het aantal uren gelijk is aan het priemgetal: als je steeds verder telt, beginnen de getallen opnieuw. In het eindige veld voor 7 is bijvoorbeeld 5 plus 2 gelijk aan nul, en 5 plus 3 gelijk aan 1.

Introductie

Een elliptische curve heeft een bijbehorende reeks getallen, genaamd ap, wat betrekking heeft op het aantal oplossingen dat er is voor de curve in het eindige veld gedefinieerd door het priemgetal p. Een kleinere ap betekent meer oplossingen; een groter ap betekent minder oplossingen. Hoewel de rangorde moeilijk te berekenen is, is de volgorde ap is een stuk makkelijker.

Op basis van talloze berekeningen uitgevoerd op een van de allereerste computers, vermoedden Birch en Swinnerton-Dyer een verband tussen de rangorde van een elliptische curve en de volgorde ap. Iedereen die kan bewijzen dat hij gelijk had, maakt kans op een miljoen dollar en wiskundige onsterfelijkheid.

Er ontstaat een verrassingspatroon

Na het begin van de pandemie is Yang-Hui He, een onderzoeker aan het London Institute for Mathematical Sciences, besloot een aantal nieuwe uitdagingen aan te gaan. Hij had op de universiteit natuurkunde gestudeerd en was gepromoveerd aan het Massachusetts Institute of Technology in wiskundige natuurkunde. Maar hij raakte steeds meer geïnteresseerd in de getaltheorie, en gezien de toenemende mogelijkheden van kunstmatige intelligentie, dacht hij dat hij eens zou proberen AI te gebruiken als hulpmiddel om onverwachte patronen in getallen te vinden. (Hij was al geweest machinaal leren gebruiken classificeren Calabi-Yau-spruitstukken, wiskundige structuren die veel worden gebruikt in de snaartheorie.)

Introductie

In augustus 2020, toen de pandemie zich verergerde, ontving de Universiteit van Nottingham hem voor een online praten. Hij was pessimistisch over zijn vooruitgang en over de mogelijkheid om machinaal leren te gebruiken om nieuwe wiskunde te ontdekken. "Zijn verhaal was dat de getaltheorie moeilijk was omdat je dingen in de getaltheorie niet machinaal kon leren," zei hij Thomas Olivier, een wiskundige aan de Universiteit van Westminster die in het publiek zat. Zoals Hij zich herinnert: 'Ik kon niets vinden omdat ik geen expert was. Ik gebruikte niet eens de juiste dingen om hiernaar te kijken.

Oliver en Kyu-Hwan Lee, een wiskundige aan de Universiteit van Connecticut, begon met He te werken. “We besloten dit alleen maar te doen om te leren wat machine learning was, in plaats van serieus wiskunde te gaan studeren,” zei Oliver. “Maar we kwamen er al snel achter dat je veel dingen machinaal kunt leren.”

Oliver en Lee stelden voor dat hij zijn technieken zou toepassen om te onderzoeken L-functies, oneindige reeksen die nauw verwant zijn aan elliptische krommen door de reeks ap. Ze zouden een online database met elliptische curven en verwante krommen kunnen gebruiken L-functies genaamd de LMFDB om hun machine learning-classificatoren te trainen. Destijds bevatte de database iets meer dan 3 miljoen elliptische krommen over de rationale getallen. In oktober 2020 was dat het geval een krant waar gebruik werd gemaakt van de verkregen informatie L-functies om een ​​bepaalde eigenschap van elliptische krommen te voorspellen. In november deelden ze een ander papier dat machinaal leren gebruikte om andere objecten in de getaltheorie te classificeren. In december konden ze dat wel voorspel de rangen van elliptische krommen met hoge nauwkeurigheid.

Maar ze wisten niet zeker waarom hun machine learning-algoritmen zo goed werkten. Lee vroeg zijn student Alexey Pozdnyakov om te zien of hij erachter kon komen wat er aan de hand was. Toevallig sorteert de LMFDB elliptische krommen volgens een grootheid die de geleider wordt genoemd en die informatie samenvat over priemgetallen waarvoor een kromme zich niet goed gedraagt. Pozdnyakov probeerde dus tegelijkertijd naar grote aantallen curven met soortgelijke geleiders te kijken – zeg maar alle curven met geleiders tussen 7,500 en 10,000.

Introductie

In totaal ging het om ongeveer 10,000 bochten. Ongeveer de helft hiervan had rang 0, en de helft rang 1. (Hogere rangen zijn buitengewoon zeldzaam.) Vervolgens berekende hij het gemiddelde van de waarden van ap voor alle rang 0-curven, afzonderlijk gemiddeld ap voor alle curven van rang 1, en de resultaten uitgezet. De twee sets stippen vormden twee afzonderlijke, gemakkelijk waarneembare golven. Dat was de reden waarom de machine learning-classificatoren de rangorde van bepaalde curven correct hadden kunnen vaststellen.

“In eerste instantie was ik gewoon blij dat ik de opdracht had volbracht”, zei Pozdnyakov. “Maar Kyu-Hwan zag meteen dat dit patroon verrassend was, en toen werd het pas echt spannend.”

Lee en Oliver waren geboeid. ‘Alexey liet ons de foto zien en ik zei dat het leek op datgene wat vogels doen,’ zei Oliver. 'En toen zocht Kyu-Hwan het op en zei dat het een gemopper heet, en toen zei Yang dat we de krant moesten bellen'Murmuraties van elliptische curven. '”

Ze uploadden hun artikel in april 2022 en stuurden het door naar een handvol andere wiskundigen, in de nerveuze verwachting dat ze te horen zouden krijgen dat hun zogenaamde ‘ontdekking’ algemeen bekend was. Oliver zei dat de relatie zo zichtbaar was dat deze al lang geleden opgemerkt had moeten worden.

Introductie

Vrijwel onmiddellijk trok de voordruk belangstelling, vooral van Andreas Sutherland, een onderzoekswetenschapper bij MIT die een van de hoofdredacteuren is van de LMFDB. Sutherland realiseerde zich dat 3 miljoen elliptische curven niet genoeg waren voor zijn doeleinden. Hij wilde naar veel grotere geleiderbereiken kijken om te zien hoe robuust het gemompel was. Hij haalde gegevens uit een andere immense opslagplaats van ongeveer 150 miljoen elliptische curven. Nog steeds ontevreden haalde hij vervolgens gegevens binnen uit een andere opslagplaats met 300 miljoen curven.

"Maar zelfs dat was niet genoeg, dus heb ik een nieuwe dataset van meer dan een miljard elliptische curven berekend, en dat is wat ik heb gebruikt om de beelden met echt hoge resolutie te berekenen," zei Sutherland. Uit het gemompel kwam naar voren of hij gemiddeld meer dan 15,000 elliptische curven tegelijk maakte of een miljoen tegelijk. De vorm bleef hetzelfde, zelfs als hij naar de curven over steeds grotere priemgetallen keek, een fenomeen dat schaalinvariantie wordt genoemd. Sutherland realiseerde zich ook dat geruis niet uniek is voor elliptische curven, maar ook in meer algemene zin voorkomt L-functies. Hij schreef een brief met een samenvatting van zijn bevindingen en stuurde het naar Sarnak en Michaël Rubinstein aan de Universiteit van Waterloo.

‘Als er een bekende verklaring voor is, verwacht ik dat jij die ook kent’, schreef Sutherland.

Dat deden ze niet.

Het patroon uitleggen

Lee, He en Oliver organiseerden in augustus 2023 een workshop over murmuraties aan het Institute for Computational and Experimental Research in Mathematics (ICERM) van Brown University. Sarnak en Rubinstein kwamen, evenals de leerling van Sarnak Nina Zubrilina.

Zubrilina presenteerde haar onderzoek naar murmuratiepatronen in modulaire vormen, speciale complexe functies die, net als elliptische krommen, geassocieerd zijn L-functies. In modulaire vormen met grote geleiders convergeren de murmuraties in een scherp gedefinieerde curve, in plaats van een waarneembaar maar verspreid patroon te vormen. In een krant gepost op 11 oktober 2023 bewees Zubrilina dat dit soort gemurmureer een expliciete formule volgt die ze ontdekte.

“Nina's grote prestatie is dat ze hiervoor een formule heeft gekregen; Ik noem het de Zubrilina-formule voor de murmureringsdichtheid, ‘zei Sarnak. “Met behulp van zeer geavanceerde wiskunde heeft ze een exacte formule bewezen die perfect bij de gegevens past.”

Haar formule is ingewikkeld, maar Sarnak noemt het een belangrijk nieuw soort functie, vergelijkbaar met de Airy-functies die oplossingen definiëren voor differentiaalvergelijkingen die in verschillende contexten in de natuurkunde worden gebruikt, variërend van optica tot kwantummechanica.

Hoewel de formule van Zubrilina de eerste was, hebben anderen gevolgd. ‘Elke week verschijnt er nu een nieuw artikel,’ zei Sarnak, ‘waarbij voornamelijk gebruik wordt gemaakt van de hulpmiddelen van Zubrilina, waarin andere aspecten van murmureren worden uitgelegd.’

Jonathan Bober, Andreas Boeker en Min lee van de Universiteit van Bristol, samen met David Lowry-Duda van ICERM, bewees het bestaan ​​van een ander soort murmureren in modulaire vormen in nog een oktoberkrant. En Kyu-Hwan Lee, Oliver en Pozdnyakov bewees het bestaan van gemompel in objecten die Dirichlet-karakters worden genoemd en die nauw verwant zijn aan L-functies.

Sutherland was onder de indruk van de aanzienlijke dosis geluk die tot de ontdekking van murmuraties had geleid. Als de elliptische curvegegevens niet door de dirigent waren besteld, zouden de geruchten verdwenen zijn. “Ze hadden het geluk dat ze gegevens van de LMFDB haalden, die voorgesorteerd waren op basis van de conducteur”, zei hij. “Het is wat een elliptische curve relateert aan de overeenkomstige modulaire vorm, maar dat is helemaal niet duidelijk. … Twee curven waarvan de vergelijkingen erg op elkaar lijken, kunnen heel verschillende geleiders hebben.’ Sutherland merkte dat bijvoorbeeld op y2 = x3 - 11x + 6 heeft geleider 17, maar verandert het minteken in een plusteken, y2 = x3 + 11x + 6 heeft geleider 100,736.

Zelfs toen werden de gemopper alleen ontdekt vanwege de onervarenheid van Pozdnyakov. 'Ik denk niet dat we het zonder hem hadden kunnen vinden,' zei Oliver, 'omdat de experts traditioneel normaliseren ap om de absolute waarde 1 te hebben. Maar hij normaliseerde ze niet … dus de oscillaties waren erg groot en zichtbaar.

De statistische patronen die AI-algoritmen gebruiken om elliptische curven op rang te sorteren, bestaan ​​in een parameterruimte met honderden dimensies – te veel voor mensen om in hun hoofd te doorzoeken, laat staan ​​te visualiseren, merkte Oliver op. Maar hoewel machinaal leren de verborgen oscillaties ontdekte, ‘begrepen we pas later dat het de gemopper was.’

Noot van de redactie: Andrew Sutherland, Kyu-Hwan Lee en de database met L-functies en modulaire formulieren (LMFDB) hebben allemaal financiering ontvangen van de Simons Foundation, die ook deze redactioneel onafhankelijke publicatie financiert. De financieringsbeslissingen van de Simons Foundation hebben geen invloed op onze dekking. Er is meer informatie beschikbaar hier.

spot_img

Laatste intelligentie

spot_img