Zephyrnet-Logo

Synthese sicherer Richtlinien unter probabilistischen Bedingungen mit Reinforcement Learning und Bayesian Model Checking. (arXiv: 2005.03898v1 [cs.AI])

Datum:

[Eingereicht am 8. Mai 2020]

PDF Downloaden

Abstract: In diesem Artikel schlagen wir Policy Synthesis unter probabilistischen Bedingungen vor
(PSyCo), eine systematische Engineering-Methode zur Synthese sicherer Richtlinien unter
probabilistische Einschränkungen mit Verstärkungslernen und Bayes'schem Modell
Überprüfung. Als Implementierung von PSyCo führen wir Safe Neural Evolutionary ein
Strategien (SNES). SNES nutzt die Bayes'sche Modellprüfung beim Lernen
Passen Sie den Lagrange eines eingeschränkten Optimierungsproblems an, das aus a abgeleitet ist
PSyCo-Spezifikation. Wir bewerten empirisch die Fähigkeit von SNES zur Synthese
machbare Richtlinien in Umgebungen mit formalen Sicherheitsanforderungen.

Einreichungsverlauf

Von: Lenz Belzner [E-Mail anzeigen]
[v1]
Fr, 8. Mai 2020 08:11:31 UTC (7,547 KB)

Quelle: http://arxiv.org/abs/2005.03898

spot_img

Neueste Intelligenz

spot_img