Логотип Зефирнет

Meta создала ИИ, который победил людей в «дипломатии»

Дата:

ИИ освоил некоторые из самых сложные игры известен человеку, но, хотя он часто превосходит конкурентов, сотрудничество не так естественно. Теперь ИИ из Meta освоил игру Diplomacy, которая требует, чтобы вы работали с другими игроками, чтобы победить.

мастерство Google в игра в го была провозглашена важной вехой для ИИ, но, несмотря на его неоспоримую сложность, он во многих отношениях хорошо подходит для холодной, расчетливой логики машины. Это игра с идеальной информацией, в которой вы полностью видите ходы своего противника, а победа просто означает возможность перехитрить другого игрока.

Дипломатия, с другой стороны, гораздо более запутанная вещь. В настольной игре принимают участие до семи игроков. за Европейские военные державы и используют свои армии, чтобы взять под контроль стратегические города. Но игрокам разрешено вести переговоры друг с другом, чтобы формировать и разрушать союзы в погоне за полным господством.

Более того, все ходы игроков делаются одновременно на каждом ходу, так что вы не можете просто реагировать на то, что делают другие. Это означает, что для победы в играх требуется сложная комбинация стратегического мышления, способности сотрудничать с другими игроками и навыков убедительного ведения переговоров. Хотя ИИ уже овладел чистой стратегией, другие навыки оказалось гораздо сложнее воспроизвести.

Однако новый ИИ, разработанный исследователями из Meta, возможно, сделал большой шаг в этом направлении. В опубликованная статья на прошлой неделе in Наука, они описывают систему под названием Cicero, которая входит в 10 процентов лучших игроков в онлайн-лиге дипломатии и набирает более чем вдвое средний балл по сравнению с игроками-людьми.

Цицерон стойкий, безжалостный и терпеливый», — сказал трехкратный чемпион мира по дипломатии Эндрю Гофф.id в видео производства Мета. «Он играет без особых человеческих эмоций, которые иногда заставляют вас принимать неправильные решения. Он просто оценивает ситуацию и принимает наилучшее решение не только для себя, но и для людей, с которыми работает».

Создание Цицерона потребовало от мета-исследователей объединения самых современных методов ИИ из двух разных подобластей: стратегического мышления и обработки естественного языка. В основе системы лежит алгоритм планирования, который предсказывает действия других игроков и использует их для определения собственной стратегии. Этому обучали, заставляя ИИ играть самого себя снова и снова, а также пытаясь имитировать то, как люди играют в игру.

Исследователи уже показали, что один только этот модуль планирования способен побеждать профессионалов-людей в упрощенной версии игры. Но в этом последнем исследовании команда объединила его с большой языковой моделью, обученной на огромном количестве текста из Интернета, а затем настроенной с использованием диалогов из 40,000 XNUMX онлайн-игр «Дипломатия». Это дало обновленному Цицерону возможность интерпретировать сообщения от других игроков. и также создать свой собственный Сообщения убедить их работать вместе.

Комбинированная система начинается с использования текущего состояния доски и прошлых диалогов, чтобы предсказать, что, вероятно, сделает каждый игрок. Затем он разрабатывает план действий как для себя, так и для своих партнеров, прежде чем генерировать сообщения, предназначенные для изложения его намерений и обеспечения сотрудничества с другими игроками.

Более 40 игр в онлайн-турнире Цицерон эффективно общался с 82 другими игроками, чтобы объяснить свои намерения, скоординировать действия и договориться об альянсах. Важно отметить, что исследователи говорят, что они не видели в игровых сообщениях доказательств того, что игроки-люди подозревали, что они объединяются с ИИ.

Однако коммуникативные способности модели не были безупречны. Он более чем способен выдавать бессмысленные сообщения или сообщения, несовместимые с его целями, поэтому исследователям приходилось генерировать несколько сообщений-кандидатов на каждом шагу, а затем использовать различные механизмы фильтрации, чтобы отсеять мусор. И даже тогда исследователи признают, что иногда проскакивают нелогичные сообщения.пед до конца.

Это говорит о том, что языковая модель, лежащая в основе Цицерона, все еще не понимает, что происходит, и просто производит правдоподобно звучащие сообщения, которые затем необходимо проверить, чтобы убедиться, что они достигают желаемых результатов.

Запись в Беседа, Исследователь ИИ Тоби Уолш из Университета Нового Южного Уэльса в Австралии также отмечает, что Цицерон безошибочно честен, в отличие от большинства игроков-людей. Хотя это удивительно эффективная стратегия, она может стать серьезной слабостью, если конкуренты поймут, что их оппонент никогда не попытается их обмануть.

Тем не менее, продвижение является значительным, и Facebook надеется, что у него могут быть приложения, выходящие далеко за рамки настольных игр. В блогеисследователи говорят, что возможность использовать алгоритмы планирования для управления генерацией языка может позволить вести гораздо более продолжительные и насыщенные разговоры с чат-ботами ИИ или создавать персонажей видеоигр, которые могут адаптироваться к поведению игрока.

Изображение Фото: MabelAmber / 4008 фотографий

Spot_img

Последняя разведка

Spot_img

Чат с нами

Всем привет! Могу я чем-нибудь помочь?