Zephyrnet-logo

Robothond leert lopen beginnend op zijn rug

Datum:

beeld

Het duurde maar een uur, maar een robothond leerde zichzelf lopen vanaf een startpunt op zijn rug.

Een onderzoeksteam van de University of California, Berkeley, ontwikkelde een nieuw algoritme op basis van wapeningsleren (RL) om robots te trainen zonder simulaties of demonstraties. 

Het systeem geeft robots een trial-and-error leermodel dat baanbrekend zou kunnen zijn voor efficiënte robottraining in de echte wereld. 

Het Dreamer-programma maakt gebruik van versterkend leren om robots te 'trainen' door continue feedback en het belonen van bots zodra een taak met succes is voltooid. 

Dreamer werd toegepast op vier robots om de RL-mogelijkheden in de praktijk te testen. 

Een viervoetige robot leerde in een uur op zijn rug staan ​​en lopen, en leerde zichzelf duwen en omrollen te weerstaan. 

Het team heeft ook twee robotarmen getraind om objecten te kiezen en te plaatsen met behulp van camerabeelden, met resultaten die beter presteerden dan modelvrije eenheden. Toen hij werd ingezet op een robot op wielen, hielp Dreamer hem om zichzelf naar een bestemming te navigeren met alleen camerabeelden.

[Ingesloten inhoud]

Doorgaans werd de training voor het leren van versterking als inefficiënt beschouwd vanwege de enorme hoeveelheid vallen en opstaan ​​​​die nodig is voordat een robot zijn gedrag aanpast. Simulaties om eenheden te trainen kunnen echter onvoldoende zijn, omdat ze slechts een klein aantal situaties uit de echte wereld kunnen vastleggen en vatbaar zijn voor onnauwkeurigheden. 

Het Dreamer-systeem verschilt enigszins van conventionele leerpraktijken met diepe bekrachtiging, waarbij een kleine hoeveelheid interactie wordt gebruikt om proefondervindelijke acties te creëren die een robot gebruikt om zijn bewegingen te plannen.

Hoewel de eerste resultaten veelbelovend zijn, zijn verdere tests nodig om te zien hoe het algoritme zal reageren op verschillende situaties, en er blijven uitdagingen bestaan ​​in de tijd die nodig is om elke robot te coderen. 

De resultaten van de studie, "DayDreamer: World Models for Physical Robot Learning", waren: gepubliceerde in het tijdschrift arXiv.

spot_img

Laatste intelligentie

spot_img