제퍼넷 로고

심층 강화 학습의 행동 공간 형성. (arXiv:2004.00980v1 [cs.AI])

시간

(2 년 2020 월 XNUMX 일 제출)

요약 : 강화 학습(RL)은 에이전트를 다양한 방식으로 교육하는 데 성공했습니다.
비디오 게임을 포함한 학습 환경. 그러나 그러한 작업은 수정 및
게임의 원본에서 행동 공간을 축소합니다. 이는 "무의미한" 작업을 시도하지 않고 구현을 용이하게 하기 위한 것입니다. 현재 이는 대부분
디자인을 지원하는 체계적인 연구가 거의 없이 직관에 기반하여 수행됨
결정. 이 작업에서 우리는 이러한 행동 공간에 대한 통찰력을 얻는 것을 목표로 합니다.
비디오 게임 환경에서 광범위한 실험을 수행하여 수정합니다.
우리의 결과는 영역별 작업 제거 및 분할이 어떻게 수행되는지 보여줍니다.
성공적인 학습을 위해서는 지속적인 행동이 중요할 수 있습니다. 이러한 인사이트를 통해
우리는 무엇을 명확히 함으로써 새로운 환경에서 RL을 쉽게 사용할 수 있기를 바랍니다.
행동 공간은 배우기 쉽습니다.

제출 이력

보낸 사람 : Anssi Kanervisto [이메일보기]
[v1]
2 년 2020 월 13 일 목요일 UTC : 25 KB

출처 : http://arxiv.org/abs/2004.00980

spot_img

최신 인텔리전스

spot_img