[Ingediend op 7 mei 2020]
Abstract: In dit artikel introduceren we plan2vec, een vorm van onbewaakt representatieleren
aanpak die is geïnspireerd door versterkend leren. Plan2vec construeert een
gewogen grafiek op een afbeeldingsgegevensset met gebruikmaking van nabije afstanden, en vervolgens
extrapoleert deze lokale metriek naar een mondiale inbedding door distillatie
pad-integraal over gepland pad. Wanneer het wordt toegepast op controle, biedt plan2vec een oplossing
om doelgerichte waardeschattingen te leren die accuraat zijn over een lange horizon
dat is zowel reken- als steekproefefficiënt. Wij demonstreren de effectiviteit van
plan2vec op één gesimuleerde en twee uitdagende real-world beelddatasets.
Experimentele resultaten laten zien dat plan2vec de planning succesvol afschrijft
kosten, waardoor reactieve planning mogelijk is die lineair is qua geheugen en berekeningen
complexiteit in plaats van uitputtend over de gehele toestandsruimte.
Inzendingsgeschiedenis
Van: Ge Yang [e-mail bekijken]
[V1]
Do 7 mei 2020 17:52:23 UTC (5,786 KB)