Zephyrnet-logo

Prestatiekennis leren, overdragen en aanbevelen met Monte Carlo-boomzoekopdrachten en neurale netwerken. (arXiv: 2005.03063v1 [cs.LG])

Datum:

[Ingediend op 6 mei 2020]

PDF downloaden

Abstract: Wijzigingen aanbrengen in een programma om de prestaties te optimaliseren, is een niet-schaalbare taak
dat is volledig afhankelijk van menselijke intuïtie en ervaring. In aanvulling op,
bedrijven die op grote schaal opereren bevinden zich in een fase waarin geen enkel individu
begrijpt de code die haar systemen bestuurt en daarom maakt
veranderingen om de prestaties te verbeteren kunnen onhandelbaar moeilijk worden. In deze krant,
er wordt een leersysteem geïntroduceerd dat AI helpt bij het vinden
aanbevolen wijzigingen in een programma. Concreet wordt getoond hoe de evaluatieve
feedback, het domein voor het programmeren van prestaties met vertraagde beloning kan effectief zijn
geformuleerd via het Monte Carlo Tree Search (MCTS) raamwerk. Het wordt dan getoond
die methoden uit computationele spellen voor het gebruik van leren heeft vastgesteld
het versnellen van de zoekberekening van bomen kan worden aangepast om het computergebruik te versnellen
aanbevolen programmawijzigingen. Schattingen van het verwachte nut van MCTS-bomen
gebouwd voor eerdere problemen worden gebruikt om een ​​steekproefbeleid te leren dat overblijft
effectief voor nieuwe problemen, en dus overdraagbaarheid van
optimalisatie kennis. Deze formulering wordt toegepast op de Apache Spark
gedistribueerde computeromgeving, en een voorlopig resultaat wordt waargenomen dat
de tijd die nodig is om een ​​zoekboom op te bouwen om aanbevelingen te vinden, wordt verminderd
met een factor van 10x.

Inzendingsgeschiedenis

Van: Don Dini [e-mail bekijken]
[V1]
Wo 6 mei 2020 18:26:03 UTC (125 KB)

Bron: http://arxiv.org/abs/2005.03063

spot_img

Laatste intelligentie

spot_img