ゼファーネットのロゴ

DeepMindは、新しいマルチゲームAIはより一般的な知能への一歩であると述べています

日付:

AI は人類に知られている最も複雑なゲームのいくつかを習得しましたが、モデルは通常、特定の種類の課題を解決するように調整されています。 開発者らによると、より幅広い種類のゲームに対応できる新しい DeepMind アルゴリズムは、より汎用的な AI への一歩となる可能性があるという。

AI のベンチマークとしてゲームを使用することには長い歴史があります。 1997 年に IBM のディープ ブルー アルゴリズムがチェスの世界チャンピオン、ガルリ カスパロフを破ったとき、それはこの分野のマイルストーンとして歓迎されました。 同様に、 DeepMindのAlphaGoが敗北 2016 年に世界のトップ囲碁棋士の XNUMX 人であるイ・セドル氏が発表したことにより、AI の可能性についての興奮が一気に高まりました。

DeepMind は、AlphaZero でのこの成功に基づいて構築されました、チェスや将棋など幅広いゲームをマスターしたモデル。 しかし、これは印象的でしたが、AlphaZero は、対戦相手の意図以外のゲームのあらゆる詳細が両方のプレイヤーに見える完全情報ゲームでのみ機能しました。 これには、両方のプレーヤーがボード上のすべての駒を常に見ることができる囲碁やチェスのようなゲームが含まれます。

対照的に、不完全情報ゲームでは、他のプレイヤーから一部の詳細が隠されます。 ポーカーは典型的な例です。なぜなら、プレイヤーは対戦相手がどのハンドを持っているかを見ることができないからです。 現在、この種のゲームでプロに勝つことができるモデルもありますが、それらは AlphaZero のようなアルゴリズムとはまったく異なるアプローチを使用しています。

現在、ディープマインドの研究者らは両方のアプローチの要素を組み合わせて、チェス、囲碁、ポーカーで人間に勝つことができるモデルを作成しました。 研究チームは、この画期的な進歩により、さまざまなタスクの解決方法を学習できる、より汎用的な AI アルゴリズムを作成する取り組みが加速する可能性があると主張しています。

完全情報ゲームをプレイする AI を構築する研究者は、通常、ツリー検索として知られるアプローチに依存しています。 これは、さまざまなブランチで潜在的な一連の動きをマッピングしながら、ゲームが現在の状態から進行できるさまざまな方法を検討します。 AlphaGo は、ツリー検索と機械学習技術を組み合わせました。この技術では、モデルが繰り返しプレイし、間違いから学習することでスキルを磨きます。

不完全情報ゲームに関しては、研究者は代わりにゲーム理論に依存し、数学的モデルを使用して戦略的問題に対する最も合理的な解決策を計画する傾向があります。 ゲーム理論は、さまざまな状況で人々がどのように選択を行うかを理解するために経済学で広く使用されており、その多くには不完全な情報が含まれます。

2016年、AIはこう呼びました。 ディープスタック ノーリミット ポーカーで人間のプロを破りましたが、モデルはその特定のゲームに高度に特化していました。 ただし、DeepStack チームの多くは現在 DeepMind で働いており、DeepStack の構築に使用した技術と AlphaZero で使用した技術を組み合わせています。

Student of Games と呼ばれるこの新しいアルゴリズムは、ツリー検索、セルフプレイ、ゲーム理論を組み合わせて、完全および不完全情報ゲームの両方に取り組みます。 で 紙の 科学、研究者らは、このアルゴリズムは、公開されている最高のポーカー プレイ AI、Slumbot を破り、AlphaZero のような特殊なアルゴリズムには及ばなかったものの、人間のプロのレベルで囲碁やチェスをプレイすることもできたと報告しています。

しかし、AI 研究においては、何かを極めるよりも、何でも屋であることのほうがより大きな価値があるのは間違いありません。 ディープラーニングは多くの場合、特定のタスクで超人的なパフォーマンスを達成できますが、幅広い問題に適用できる、より一般的な形式の AI を開発するのはより困難です。 研究者らは、完全情報ゲームと不完全情報ゲームの両方に取り組むことができるモデルは「任意の環境向けの真に汎用的なアルゴリズムに向けた重要な一歩」であると述べている。

英国エジンバラ大学のマイケル・ロヴァツォス氏は、結果から過度に推定しないことが重要であると述べています。 言われ ニュー·サイエンティスト. AI は依然として、可能なアクションの数が制限され、ルールが明確に定義されている、ゲームという単純で制御された環境内で動作していました。 それは現実世界の厄介な現実とはかけ離れています。

しかし、たとえこれが小さな一歩だったとしても、XNUMX つのまったく異なる種類のゲームに対する主要なアプローチを XNUMX つのモデルに統合できることは重要な成果です。 そして、これは将来、より高機能で汎用的なモデルの青写真となる可能性があります。

画像のクレジット: ハッサン・パシャ / Unsplash

スポット画像

最新のインテリジェンス

スポット画像