(2 년 2020 월 XNUMX 일 제출)
요약 : 강화 학습(RL)은 에이전트를 다양한 방식으로 교육하는 데 성공했습니다.
비디오 게임을 포함한 학습 환경. 그러나 그러한 작업은 수정 및
게임의 원본에서 행동 공간을 축소합니다. 이는 "무의미한" 작업을 시도하지 않고 구현을 용이하게 하기 위한 것입니다. 현재 이는 대부분
디자인을 지원하는 체계적인 연구가 거의 없이 직관에 기반하여 수행됨
결정. 이 작업에서 우리는 이러한 행동 공간에 대한 통찰력을 얻는 것을 목표로 합니다.
비디오 게임 환경에서 광범위한 실험을 수행하여 수정합니다.
우리의 결과는 영역별 작업 제거 및 분할이 어떻게 수행되는지 보여줍니다.
성공적인 학습을 위해서는 지속적인 행동이 중요할 수 있습니다. 이러한 인사이트를 통해
우리는 무엇을 명확히 함으로써 새로운 환경에서 RL을 쉽게 사용할 수 있기를 바랍니다.
행동 공간은 배우기 쉽습니다.
제출 이력
보낸 사람 : Anssi Kanervisto [이메일보기]
[v1]
2 년 2020 월 13 일 목요일 UTC : 25 KB