Synthetiseren van veilig beleid onder probabilistische beperkingen met versterkend leren en Bayesiaanse modelcontrole. (arXiv:2005.03898v1 [cs.AI])

[Ingediend op 8 mei 2020]

Abstract: In dit artikel stellen we beleidssynthese voor onder probabilistische beperkingen
(PSyCo), een systematische engineeringmethode voor het synthetiseren van veilig beleid onder
probabilistische beperkingen met versterkingsleren en Bayesiaans model
controleren. Als implementatie van PSyCo introduceren we Safe Neural Evolutionary
Strategieën (SNES). SNES maakt gebruik van Bayesiaanse modelcontrole tijdens het leren
pas de Lagrangiaan aan van een beperkt optimalisatieprobleem afgeleid van a
PSyCo-specificatie. We evalueren empirisch het vermogen van SNES om te synthetiseren
haalbaar beleid in omgevingen met formele veiligheidseisen.

Inzendingsgeschiedenis

Van: Lenz Belzner [e-mail bekijken]
[V1]
Vr 8 mei 2020 08:11:31 UTC (7,547 KB)

Bron: http://arxiv.org/abs/2005.03898

Generatieve data-intelligentie

Veilig beleid synthetiseren onder probabilistische beperkingen met Reinforcement Learning en Bayesiaanse modelcontrole. (arXiv: 2005.03898v1 [cs.AI])

Inzendingsgeschiedenis

De legitimiteit van Option2Trade (O2T) tijdens de voortdurende voorverkoop

De legitimiteit van Option2Trade (O2T) tijdens de voortdurende voorverkoop

Laatste intelligentie

VanEck-dochteronderneming lanceert index om Dogecoin, Shiba Inu en WIF te volgen - waarom het echt belangrijk is voor crypto

VanEck-dochteronderneming lanceert index om Dogecoin, Shiba Inu en WIF te volgen - waarom het echt belangrijk is voor crypto

VanEck-dochteronderneming lanceert index om Dogecoin, Shiba Inu en WIF te volgen - waarom het echt belangrijk is voor crypto

Genoeg gedoe: het ETS moet zijn werk kunnen doen

Binance en KuCoin winnen registratie bij de financiële inlichtingeneenheid van India

Stand met Crypto zet verkiezingsoorlogskist op, steunt kandidaten die op zoek zijn naar open stoelen