ゼファーネットのロゴ

Facebookが歴史上最も困難な強化学習の課題のXNUMXつを開始

日付:

Facebookが歴史上最も困難な強化学習の課題のXNUMXつを開始

FAIRチームは、次のNeurIPS2021コンペティションの一環としてNetHackチャレンジを開始しました。 目的は、世界で最も過酷なゲーム環境のXNUMXつを使用して、新しいRLのアイデアをテストすることです。




画像クレジット:Facebook Research

 

私は最近、AI教育に焦点を当てた新しいニュースレターを開始しました。 すでに50,000人以上の加入者がいます。 TheSequenceは、BS(誇大広告やニュースなどがないことを意味します)のAIに焦点を当てたニュースレターで、読むのに5分かかります。 目標は、機械学習プロジェクト、研究論文、概念を最新の状態に保つことです。 以下を購読して、試してみてください。

画像

強化学習(RL)は、過去2年間の人工知能(AI)における最も印象的な成果の中心にあります。 DeepMindの有名なAlphaGoから、StarCraft II、Dota XNUMX、Minecraftなどのゲームのマイルストーンまで、RLはディープラーニングスペースで最も急速に成長している分野のXNUMXつです。 すべての成功にもかかわらず、Facebook AI Research(FAIR)は、RLを新しいレベルに押し上げる必要があると考えており、そのために、新しいゲームであるNetHackに注目しています。

FAIRチームはちょうど立ち上げました NetHackチャレンジ 今後の一環として NeurIPS2021コンペティション。 目的は、世界で最も過酷なゲーム環境のXNUMXつを使用して、新しいRLのアイデアをテストすることです。

NetHackとRL

 
NetHackは、1980年代から開発されてきた伝統的なダンジョンゲームであり、新しいプレーヤーをマスターするのは非常に困難です。 かつて、NetHackのミスには不釣り合いなコストがかかります。 プレイヤーが死ぬと、ゲームはまったく別のダンジョンでゼロから始まります。 ゲームを正常に完了するには、プレイヤーはStarCraftよりも約25〜50倍多くのステップを実行する必要があります。 さらに、NetHackの多くの問題の解決には、創造性と外部の知識源への相談が必要であり、戦略的な観点からモデル化するのは非常に困難です。



画像クレジット:Facebook Research



画像クレジット:Facebook Research

 

RLの観点から、NetHackは独自の一連の課題を提示します。

  • エージェントは環境をリセットできないため、モンテカルロ木探索などの最適化方法は、そのタイプの設定では役に立ちません。
  • 環境が部分的に完全であることを考えると、探索はさらに重要です。
  • 環境の変化の変動性が高いため、迅速に適応するRL技術が必要です。

とりわけ、NetHackの課題は、エラーに多大なコストがかかる非常に複雑な環境で動作できる新しいRLメソッドのセットをもたらすはずです。 これは、ナビゲーションや、NetHackといくつかのマクロ特性を共有する多くの産業環境などの分野での研究を進めるのに役立つはずです。 提出物の最初の波を見るのが待ちきれません。

 
元の。 許可を得て転載。

関連する

コインスマート。 BesteBitcoin-ヨーロッパのBörse
出典:https://www.kdnuggets.com/2021/06/facebook-launches-toughest-reinforcement-learning-challenges.html

スポット画像

最新のインテリジェンス

スポット画像