Logotipo de Zephyrnet

Etiqueta: aprendizaje reforzado

Aprendiendo jugando

Lograr que los niños (y los adultos) limpien sus cosas puede ser un desafío, pero nos enfrentamos a un desafío aún mayor al tratar de...

Documentos de DeepMind en NIPS 2017

Un módulo de red neuronal simple para el razonamiento relacional Autores: Adam Santoro, David Raposo, David Barrett, Mateusz Malinowski, Razvan Pascanu, Peter Battaglia, Timothy Lillicrap “Demostramos...

El hipocampo como mapa predictivo

Este enfoque combina las fortalezas de dos algoritmos que ya son bien conocidos en el aprendizaje por refuerzo y también se cree que existen en...

Documentos de DeepMind en ICML 2017 (tercera parte)

Control episódico neuronalAutores: Alex Pritzel, Benigno Uria, Sriram Srinivasan, Adria Puigdomenech, Oriol Vinyals, Demis Hassabis, Daan Wierstra, Charles BlundellLos algoritmos de aprendizaje por refuerzo profundo tienen...

Documentos de DeepMind en ICML 2017 (segunda parte)

DARLA: Mejorando la transferencia de tiro cero en el aprendizaje por refuerzoAutores: Irina Higgins*, Arka Pal*, Andrei Rusu, Loic Matthey, Chris Burgess, Alexander Pritzel, Matt Botvinick, Charles Blundell,...

IA y neurociencia: un círculo virtuoso

Otro desafío clave en la investigación contemporánea de IA se conoce como aprendizaje de transferencia. Ser capaz de hacer frente con eficacia a situaciones novedosas, agentes artificiales...

Ir más allá del promedio para el aprendizaje de refuerzo

Considere al viajero que trabaja duro hacia adelante y hacia atrás todos los días en un tren. La mayoría de las mañanas, su tren sale a tiempo y ella llega...

DeepMind se expande a Canadá con una nueva oficina de investigación en Edmonton, Alberta

Esto es lo que otros tienen que decir sobre DeepMind Alberta: Rich Sutton: "DeepMind ha puesto un énfasis especial en el aprendizaje por refuerzo desde el principio, y...

Nuestras colaboraciones con la academia para avanzar en el campo de la IA

También queremos hacer una contribución más directa al aprendizaje académico y la formación de la próxima generación de profesionales del aprendizaje automático, y así,...

Aprendizaje de refuerzo con tareas auxiliares no supervisadas

La combinación de estas tareas auxiliares, junto con nuestro documento A3C anterior, es nuestro nuevo agente UNREAL (REinforcement y Auxiliary Learning sin supervisión). Probamos esto...

Interfaces neuronales desacopladas utilizando gradientes sintéticos

Este gráfico muestra la aplicación de un RNN entrenado en la próxima predicción de caracteres en Penn Treebank, un problema de modelado de lenguaje. En el eje y la...

Aprendizaje de refuerzo profundo

Posteriormente, hemos mejorado el algoritmo DQN de muchas maneras: estabilizando aún más la dinámica de aprendizaje; priorizar las experiencias reproducidas; normalizando, agregando y redimensionando...

Información más reciente

punto_img
punto_img