심층 강화 학습에서 행동 공간 형성. (arXiv:2004.00980v1 [cs.AI])

(2 년 2020 월 XNUMX 일 제출)

요약 : 강화 학습(RL)은 에이전트를 다양한 방식으로 교육하는 데 성공했습니다.
비디오 게임을 포함한 학습 환경. 그러나 그러한 작업은 수정 및
게임의 원본에서 행동 공간을 축소합니다. 이는 "무의미한" 작업을 시도하지 않고 구현을 용이하게 하기 위한 것입니다. 현재 이는 대부분
디자인을 지원하는 체계적인 연구가 거의 없이 직관에 기반하여 수행됨
결정. 이 작업에서 우리는 이러한 행동 공간에 대한 통찰력을 얻는 것을 목표로 합니다.
비디오 게임 환경에서 광범위한 실험을 수행하여 수정합니다.
우리의 결과는 영역별 작업 제거 및 분할이 어떻게 수행되는지 보여줍니다.
성공적인 학습을 위해서는 지속적인 행동이 중요할 수 있습니다. 이러한 인사이트를 통해
우리는 무엇을 명확히 함으로써 새로운 환경에서 RL을 쉽게 사용할 수 있기를 바랍니다.
행동 공간은 배우기 쉽습니다.

제출 이력

보낸 사람 : Anssi Kanervisto [이메일보기]
[v1]
2 년 2020 월 13 일 목요일 UTC : 25 KB

출처 : http://arxiv.org/abs/2004.00980

생성 데이터 인텔리전스

심층 강화 학습의 행동 공간 형성. (arXiv:2004.00980v1 [cs.AI])

제출 이력

Biden은 SEC 암호화 은행 정책을 철회하기 위해 법안을 죽이겠다고 맹세합니다 – 암호 해독

바이낸스 CEO, 나이지리아 당국 폭로: 구금된 임원의 즉각적인 석방 요구

최신 인텔리전스

SEC는 리플에 대한 '손목을 때리는' 것 이상을 원합니다 – Decrypt

SEC는 리플에 대한 '손목을 때리는' 것 이상을 원합니다 – Decrypt

나이지리아, 바이낸스 뇌물수수 혐의 '협박' 주장

Shark Cat Solana Meme 코인 싸움은 법적 싸움 없이 끝납니다 - 해독

Grayscale의 Ether Futures ETF 신청이 취소되었지만 이유는 공개되지 않았습니다.

바이든 행정부, 논란이 되고 있는 SEC 암호화폐 규정 뒤집기를 거부