Synthese sicherer Richtlinien unter probabilistischen Einschränkungen mit Reinforcement Learning und Bayes'scher Modellprüfung. (arXiv:2005.03898v1 [cs.AI])

[Eingereicht am 8. Mai 2020]

Abstract: In diesem Artikel schlagen wir Policy Synthesis unter probabilistischen Bedingungen vor
(PSyCo), eine systematische Engineering-Methode zur Synthese sicherer Richtlinien unter
probabilistische Einschränkungen mit Verstärkungslernen und Bayes'schem Modell
Überprüfung. Als Implementierung von PSyCo führen wir Safe Neural Evolutionary ein
Strategien (SNES). SNES nutzt die Bayes'sche Modellprüfung beim Lernen
Passen Sie den Lagrange eines eingeschränkten Optimierungsproblems an, das aus a abgeleitet ist
PSyCo-Spezifikation. Wir bewerten empirisch die Fähigkeit von SNES zur Synthese
machbare Richtlinien in Umgebungen mit formalen Sicherheitsanforderungen.

Einreichungsverlauf

Von: Lenz Belzner [E-Mail anzeigen]
[v1]
Fr, 8. Mai 2020 08:11:31 UTC (7,547 KB)

Quelle: http://arxiv.org/abs/2005.03898

Generative Datenintelligenz

Synthese sicherer Richtlinien unter probabilistischen Bedingungen mit Reinforcement Learning und Bayesian Model Checking. (arXiv: 2005.03898v1 [cs.AI])

Einreichungsverlauf

Interactive Brokers bietet britischen Kunden Krypto-Handel

ETS-Konsultation schlägt niedrigere Preise für NZUs vor

Neueste Intelligenz

Rückblick auf die thailändische Liga, Woche 28: „Buriram“ wartet auf ein weiteres Spiel, „Bangkok“ gibt die Hoffnung immer noch nicht auf, „Chonburi“ hat Schwierigkeiten zu überleben.

Match-Trade gibt Ernennung eines neuen CCO im Zuge der Neugestaltung des Managements bekannt

Match-Trade gibt Ernennung eines neuen CCO im Zuge der Neugestaltung des Managements bekannt

Auswahl der richtigen Prop-Trading-Plattform – Interview mit James Glyde, CEO von PipFarm

7 Frosty Gelato Auto KOSTENLOS

Colony Lab präsentiert die allererste „Liquid Vesting“-Funktion für Krypto-Investitionen im Frühstadium