Robothond leert lopen vanaf zijn rug - Plato Data Intelligence

Het duurde maar een uur, maar een robothond leerde zichzelf lopen vanaf een startpunt op zijn rug.

Een onderzoeksteam van de University of California, Berkeley, ontwikkelde een nieuw algoritme op basis van wapeningsleren (RL) om robots te trainen zonder simulaties of demonstraties.

Het systeem geeft robots een trial-and-error leermodel dat baanbrekend zou kunnen zijn voor efficiënte robottraining in de echte wereld.

Het Dreamer-programma maakt gebruik van versterkend leren om robots te 'trainen' door continue feedback en het belonen van bots zodra een taak met succes is voltooid.

Dreamer werd toegepast op vier robots om de RL-mogelijkheden in de praktijk te testen.

Een viervoetige robot leerde in een uur op zijn rug staan en lopen, en leerde zichzelf duwen en omrollen te weerstaan.

Het team heeft ook twee robotarmen getraind om objecten te kiezen en te plaatsen met behulp van camerabeelden, met resultaten die beter presteerden dan modelvrije eenheden. Toen hij werd ingezet op een robot op wielen, hielp Dreamer hem om zichzelf naar een bestemming te navigeren met alleen camerabeelden.

[Ingesloten inhoud]

Doorgaans werd de training voor het leren van versterking als inefficiënt beschouwd vanwege de enorme hoeveelheid vallen en opstaan die nodig is voordat een robot zijn gedrag aanpast. Simulaties om eenheden te trainen kunnen echter onvoldoende zijn, omdat ze slechts een klein aantal situaties uit de echte wereld kunnen vastleggen en vatbaar zijn voor onnauwkeurigheden.

Het Dreamer-systeem verschilt enigszins van conventionele leerpraktijken met diepe bekrachtiging, waarbij een kleine hoeveelheid interactie wordt gebruikt om proefondervindelijke acties te creëren die een robot gebruikt om zijn bewegingen te plannen.

Hoewel de eerste resultaten veelbelovend zijn, zijn verdere tests nodig om te zien hoe het algoritme zal reageren op verschillende situaties, en er blijven uitdagingen bestaan in de tijd die nodig is om elke robot te coderen.

De resultaten van de studie, "DayDreamer: World Models for Physical Robot Learning", waren: gepubliceerde in het tijdschrift arXiv.

Generatieve data-intelligentie

Robothond leert lopen beginnend op zijn rug

Deutsche Bank sluit zich aan bij MAS' Project Guardian om activatokenisatie te onderzoeken - Fintech Singapore

Authenticiteit in het tijdperk van deepfakes: de meerlaagse ZOLOZ eKYC-aanpak – Fintech Singapore

Laatste intelligentie

Zijn gamingtokens het volgende grote ding in virtuele financiën?

Recordreductie van de Europese ETS-emissies in 2023.

Verminderde emissierecords van ETS Europa in 2023.

Cybersecurity-update van Singapore stelt cloudproviders op de hoogte

Andrew Tate steekt $6 miljoen in Gamestop terwijl de rage op het gebied van meme-aandelen Wall Street blijft choqueren

Microsoft Windows DWM Zero-Day klaar voor massale exploitatie