Логотип Зефирнет

Эллиптическая кривая «Руммурации», обнаруженная с помощью искусственного интеллекта, взлетает | Журнал Кванта

Дата:

Введение

Эллиптические кривые — один из наиболее интересных объектов современной математики. Они не кажутся сложными, но образуют скоростную дорогу между математикой, которую многие люди изучают в средней школе, и математическими исследованиями в самых сложных ее проявлениях. Они сыграли центральную роль в знаменитом доказательстве Великой теоремы Ферма, предложенном Эндрю Уайлсом в 1990-х годах. Они являются ключевыми инструментами современной криптографии. А в 2000 году Математический институт Клэя назвал предположение о статистике эллиптических кривых, одна из семи «задач тысячелетия», за решение каждой из которых предусмотрена премия в 1 миллион долларов. Эта гипотеза, впервые высказанная Брайан Берч и Питер Суиннертон-Дайер в 1960-х годах, до сих пор не доказано.

Понимание эллиптических кривых — задача с высокими ставками, занимающая центральное место в математике. Поэтому в 2022 году, когда трансатлантическое сотрудничество использовало статистические методы и искусственный интеллект для обнаружения совершенно неожиданных закономерностей в эллиптических кривых, это был долгожданный, хотя и неожиданный вклад. «Это был всего лишь вопрос времени, когда машинное обучение появится у нас на пороге с чем-то интересным», — сказал Петр Сарнак, математик Института перспективных исследований и Принстонского университета. Первоначально никто не мог объяснить, почему существуют вновь обнаруженные закономерности. С тех пор в серии недавних работ математики начали раскрывать причины закономерностей, получивших название «шумов» из-за их сходства с плавными формами стайящихся скворцов, и начали доказывать, что они должны возникать не только в определенных примеры рассмотрены в 2022 году, но в более общем плане - на эллиптических кривых.

Как важно быть эллиптическим

Чтобы понять, что это за закономерности, нам нужно немного разобраться в том, что такое эллиптические кривые и как математики их классифицируют.

Эллиптическая кривая связывает квадрат одной переменной, обычно записываемой как y, в третьей степени другого, обычно записываемого как x: y2 = x3 + Ax + B, для некоторой пары чисел A и BТех пор, пока A и B выполнить несколько простых условий. Это уравнение определяет кривую, которую можно построить на плоскости, как показано ниже. (Несмотря на сходство названий, эллипс не является эллиптической кривой.)

Введение

Несмотря на свою простоту, эллиптические кривые оказываются невероятно мощным инструментом для теоретиков чисел — математиков, которые ищут закономерности в целых числах. Вместо того, чтобы позволять переменным x и y диапазон по всем числам, математики любят ограничивать их различными системами счисления, что они называют определением кривой «над» данной системой счисления. Эллиптические кривые, ограниченные рациональными числами — числами, которые можно записать в виде дробей, — особенно полезны. «Эллиптические кривые над действительными или комплексными числами довольно скучны», — сказал Сарнак. «Только рациональные числа глубоки».

Вот один из способов, который является правдой. Если вы проведете прямую линию между двумя рациональными точками на эллиптической кривой, то место, где эта линия снова пересечет кривую, также будет рациональным. Вы можете использовать этот факт для определения «сложения» в эллиптической кривой, как показано ниже.

Введение

Проведите линию между P и Q. Эта линия пересечет кривую в третьей точке, R. (У математиков есть специальный прием, позволяющий справиться со случаем, когда прямая не пересекает кривую, путем добавления «точки, находящейся в бесконечности».) Отражение R через x-ось — это ваша сумма P + Q. Вместе с этой операцией сложения все решения кривой образуют математический объект, называемый группой.

Математики используют это для определения «ранга» кривой. ранг кривой зависит от количества рациональных решений, которые он имеет. Кривые ранга 0 имеют конечное число решений. Кривые с более высоким рангом имеют бесконечное количество решений, связь которых друг с другом с помощью операции сложения описывается рангом.

Ранги не совсем понятны; математики не всегда имеют возможность их вычислить и не знают, насколько большими они могут стать. (Наибольший точный ранг, известный для конкретной кривой, равен 20.) Кривые одинакового вида могут иметь совершенно разные ранги.

Эллиптические кривые также во многом связаны с простыми числами, которые делятся только на 1 и самих себя. В частности, математики изучают кривые над конечными полями — системами циклической арифметики, определенными для каждого простого числа. Конечное поле похоже на часы, в которых количество часов равно простому числу: если вы продолжаете считать вверх, числа начинаются заново. Например, в конечном поле для 7 5 плюс 2 равняется нулю, а 5 плюс 3 равняется 1.

Введение

Эллиптическая кривая имеет связанную с ней последовательность чисел, называемую ap, который относится к числу решений кривой в конечном поле, определяемом простым числом p. Меньший ap означает больше решений; больший ap означает меньше решений. Хотя ранг трудно вычислить, последовательность ap это намного проще.

На основе многочисленных расчетов, выполненных на одном из самых первых компьютеров, Берч и Суиннертон-Дайер выдвинули гипотезу о связи между рангом эллиптической кривой и последовательностью ap. Любой, кто сможет доказать свою правоту, получит миллион долларов и математическое бессмертие.

Появляется неожиданная закономерность

После начала пандемии Ян-Хуэй Хэ, исследователь из Лондонского института математических наук, решил взяться за новые задачи. В колледже он изучал физику и получил докторскую степень по математической физике в Массачусетском технологическом институте. Но его все больше интересовала теория чисел, и, учитывая растущие возможности искусственного интеллекта, он решил попробовать свои силы в использовании ИИ в качестве инструмента для поиска неожиданных закономерностей в числах. (Он уже был с помощью машинного обучения классифицировать Многообразия Калаби-Яу, математические структуры, которые широко используются в теории струн.)

Введение

В августе 2020 года, когда пандемия усилилась, Ноттингемский университет принял его на онлайн-разговор. Он пессимистично оценивал свои успехи и саму возможность использования машинного обучения для открытия новых математических вычислений. «Его рассказ заключался в том, что теория чисел сложна, потому что в теории чисел невозможно машинное обучение», — сказал Томас Оливер, математик из Вестминстерского университета, который был в аудитории. Как Он вспоминает: «Я ничего не мог найти, потому что не был экспертом. Я даже не использовал правильные вещи, чтобы посмотреть на это».

Оливер и Кю-Хван Ли, математик из Университета Коннектикута, начал работать с Хе. «Мы решили сделать это просто для того, чтобы узнать, что такое машинное обучение, а не для серьезного изучения математики», — сказал Оливер. «Но мы быстро обнаружили, что можно многому научиться с помощью машин».

Оливер и Ли предложили Ему применить свои методы для изучения L-функции, бесконечные ряды, тесно связанные с эллиптическими кривыми через последовательность ap. Они могли бы использовать онлайн-базу данных эллиптических кривых и связанных с ними данных. L-функции, называемые ЛМФДБ для обучения своих классификаторов машинного обучения. В то время в базе данных было чуть более 3 миллионов эллиптических кривых поверх рациональных чисел. К октябрю 2020 года у них было бумага который использовал информацию, полученную из L-функции для прогнозирования определенного свойства эллиптических кривых. В ноябре они поделились другая бумага которые использовали машинное обучение для классификации других объектов теории чисел. К декабрю им удалось предсказать ранги эллиптических кривых с высокой точностью.

Но они не были уверены, почему их алгоритмы машинного обучения работают так хорошо. Ли попросил своего студента Алексея Позднякова проверить, сможет ли он понять, что происходит. Так получилось, что LMFDB сортирует эллиптические кривые в соответствии с величиной, называемой проводником, которая суммирует информацию о простых числах, для которых кривая ведет себя некорректно. Поэтому Поздняков попытался одновременно рассмотреть большое количество кривых с одинаковыми проводниками — скажем, все кривые с числом проводников от 7,500 до 10,000 XNUMX.

Введение

Всего это составило около 10,000 0 кривых. Около половины из них имели ранг 1, а половина — ранг XNUMX. (Более высокие ранги встречаются крайне редко.) Затем он усреднил значения ap для всех кривых ранга 0, усредненных по отдельности ap для всех кривых ранга 1 и построили результаты. Два набора точек образовали две отдельные, легко различимые волны. Именно поэтому классификаторы машинного обучения смогли правильно определить ранги конкретных кривых.

«Сначала я просто был рад, что выполнил задание», — сказал Поздняков. «Но Кю-Хван сразу понял, что эта закономерность удивительна, и именно тогда она стала по-настоящему захватывающей».

Ли и Оливер были в восторге. «Алексей показал нам фотографию, и я сказал, что она похожа на то, что делают птицы», — сказал Оливер. «А потом Кю-Хван посмотрел и сказал, что это называется ропот, а затем Ян сказал, что нам следует позвонить в газету».Шум эллиптических кривых

Они загрузили свою статью в апреле 2022 года и разослали ее нескольким другим математикам, нервно ожидая, что им скажут, что их так называемое «открытие» хорошо известно. Оливер сказал, что отношения были настолько заметными, что их следовало бы заметить уже давно.

Введение

Почти сразу же препринт вызвал интерес, особенно со стороны Эндрю Сазерленд, учёный-исследователь Массачусетского технологического института, один из главных редакторов LMFDB. Сазерленд понял, что 3 миллионов эллиптических кривых недостаточно для его целей. Он хотел изучить гораздо более широкие диапазоны проводников, чтобы увидеть, насколько устойчивы эти шумы. Он извлек данные из другого огромного хранилища, содержащего около 150 миллионов эллиптических кривых. Все еще неудовлетворенный, он затем извлек данные из другого хранилища с 300 миллионами кривых.

«Но даже этого было недостаточно, поэтому я фактически вычислил новый набор данных, состоящий из более чем миллиарда эллиптических кривых, и это то, что я использовал для расчета изображений действительно высокого разрешения», — сказал Сазерленд. Шумы появлялись независимо от того, делал ли он в среднем более 15,000 XNUMX эллиптических кривых за раз или миллион за раз. Форма оставалась неизменной, даже когда он смотрел на кривые все больших и больших простых чисел — явление, называемое масштабной инвариантностью. Сазерленд также понял, что шумы характерны не только для эллиптических кривых, но и возникают в более общих случаях. L-функции. Он написал письмо с изложением своих выводов и отправил его в Сарнак и Майкл Рубинштейн в университете Ватерлоо.

«Если этому есть известное объяснение, я надеюсь, вы его знаете», — написал Сазерленд.

Они этого не сделали.

Объяснение шаблона

Ли, Хе и Оливер организовали семинар по ропотам в августе 2023 года в Институте вычислительных и экспериментальных исследований в математике (ICERM) Университета Брауна. Пришли Сарнак и Рубинштейн, а также ученик Сарнака. Нина Зубрилина.

Зубрилина представила свое исследование закономерностей шумов в модульные формы, специальные комплексные функции, которые, подобно эллиптическим кривым, связаны L-функции. В модульных формах с большими проводниками борозды сходятся в четко очерченную кривую, а не образуют различимый, но рассеянный рисунок. В бумага В публикации от 11 октября 2023 года Зубрилина доказала, что этот тип шумов следует явной формуле, которую она обнаружила.

«Большим достижением Нины является то, что она дала для этого формулу; Я называю это формулой плотности шумов Зубрилины», — сказал Сарнак. «Используя сложную математику, она доказала точную формулу, которая идеально соответствует данным».

Ее формула сложна, но Сарнак приветствует ее как важный новый вид функции, сравнимый с функциями Эйри, которые определяют решения дифференциальных уравнений, используемых в самых разных областях физики, от оптики до квантовой механики.

Хотя формула Зубрилиной была первой, за ней последовали и другие. «Теперь каждую неделю выходит новая статья, — сказал Сарнак, — в основном с использованием инструментов Зубрилиной, объясняющая другие аспекты ропота».

Джонатан Бобер, Эндрю Букер и Мин ли Бристольского университета совместно с Дэвид Лоури-Дуда ICERM, доказали существование другого типа бормотания в модульных формах у еще одна октябрьская газета. И Кю-Хван Ли, Оливер и Поздняков доказал существование шумов в объектах, называемых персонажами Дирихле, которые тесно связаны с L-функции.

Сазерленд был впечатлен значительной долей удачи, которая привела к открытию ропота. Если бы данные эллиптической кривой не были заказаны проводником, шумы бы исчезли. «Им повезло, что они взяли данные из LMFDB, которые были предварительно отсортированы по словам проводника», — сказал он. «Это то, что связывает эллиптическую кривую с соответствующей модульной формой, но это совсем не очевидно. … Две кривые, уравнения которых выглядят очень похожими, могут иметь совершенно разные проводники». Например, Сазерленд отметил, что y2 = x3 -11x +6 имеет проводник 17, но переворачивает знак минус на знак плюс, y2 = x3 + 11x +6 имеет проводник 100,736.

Но и тогда шумы были обнаружены только по неопытности Позднякова. «Я не думаю, что мы бы нашли это без него, — сказал Оливер, — потому что эксперты традиционно нормализуют ap иметь абсолютное значение 1. Но он их не нормализовал… поэтому колебания были очень большими и заметными».

Статистические закономерности, которые алгоритмы ИИ используют для сортировки эллиптических кривых по рангу, существуют в пространстве параметров с сотнями измерений — слишком много, чтобы люди могли разобраться в них, не говоря уже о визуализации, отметил Оливер. Но хотя машинное обучение обнаружило скрытые колебания, «только позже мы поняли, что это ропот».

Примечание редактора: Эндрю Сазерленд, Кю-Хван Ли и база данных L-функций и модульных форм (LMFDB) получили финансирование от Фонда Саймонса, который также финансирует это редакционно независимое издание. Решения о финансировании Фонда Саймонса не влияют на наше освещение. Более подробная информация доступна здесь.

Spot_img

Последняя разведка

Spot_img