Zephyrnet-logo

Label: versterking van leren

TF-Replicator: gedistribueerde machine learning voor onderzoekers

Een platform bouwen voor AI-onderzoek bij DeepMind Door nauw samen te werken met onderzoekers tijdens het ontwerp en de implementatie van TF-Replicator, konden we...

Open sourcing TRFL: een bibliotheek met bouwstenen voor versterkend leren

Vandaag zijn we bezig met het opensourcen van een nieuwe bibliotheek met nuttige bouwstenen voor het schrijven van RL-agents (versterking leren) in TensorFlow. Genaamd TRFL (uitgesproken als...

Behoudt de output nauwkeurig en past de doelen adaptief aan

Multi-task learning - waardoor een enkele agent kan leren hoe hij veel verschillende taken moet oplossen - is een al lang bestaand doel van kunstmatige intelligentie...

Het is 2018 - dus, VMware prijst natuurlijk open source blockchain-code, Internet-of-Things-tools

VMworld US Het is dag twee van VMware's VMworld 2018 US-conferentie in Las Vegas, en hier is een korte handleiding voor wat er nieuw is. De...

DeepMind-papers op ICML 2018

Efficiënte neurale audiosynthese Auteurs: Nal Kalchbrenner, Erich Elsen, Karen Simonyan, Seb Nouri, Norman Casagrande, Edward Lockhart, Sander Dieleman, Aaron van den Oord, Koray...

Prefrontale cortex als een meta-versterkend leersysteem

We ontdekten zelfs dat de meta-RL-agent kon leren om zich snel aan te passen in een breed domein van taken met verschillende regels en...

DeepMind-papers op ICLR 2018

Maximale a posteriori beleidsoptimalisatie Auteurs: Abbas Abdolmaleki, Jost Tobias Springenberg, Nicolas Heess, Yuval Tassa, Remi MunosWe introduceren een nieuw algoritme voor versterkend leren...

Leren navigeren in steden zonder kaart

Navigatie leren zonder kaarten te bouwen We vertrekken van de traditionele benaderingen die berusten op expliciete mapping en verkenning (zoals een cartograaf die probeert...

Spelenderwijs leren

Kinderen (en volwassenen) zelf opruimen kan een uitdaging zijn, maar we staan ​​voor een nog grotere uitdaging om...

DeepMind-papers op NIPS 2017

Een eenvoudige neurale netwerkmodule voor relationeel redeneren Auteurs: Adam Santoro, David Raposo, David Barrett, Mateusz Malinowski, Razvan Pascanu, Peter Battaglia, Timothy Lillicrap “We demonstreren...

De hippocampus als voorspellende kaart

Deze aanpak combineert de sterke punten van twee algoritmen die al bekend zijn bij het versterken van leren en waarvan wordt aangenomen dat ze ook bestaan ​​in...

DeepMind papers op ICML 2017 (deel twee)

DARLA: Verbetering van Zero-Shot Transfer in Reinforcement LearningAuteurs: Irina Higgins*, Arka Pal*, Andrei Rusu, Loic Matthey, Chris Burgess, Alexander Pritzel, Matt Botvinick, Charles Blundell,...

Laatste intelligentie

spot_img
spot_img