Λογότυπο Zephyrnet

Παρακολουθήστε ένα ρομπότ σκυλιών τεχνητής νοημοσύνης σε ένα μάθημα ευκινησίας που δεν έχει ξαναδεί

Ημερομηνία:

Τα ρομπότ που κάνουν ακροβατικά μπορεί να είναι ένα εξαιρετικό τέχνασμα μάρκετινγκ, αλλά συνήθως αυτές οι οθόνες είναι εξαιρετικά χορογραφημένες και προγραμματισμένες με κόπο. Τώρα οι ερευνητές έχουν εκπαιδεύσει ένα τετράποδο ρομπότ τεχνητής νοημοσύνης για να αντιμετωπίζει περίπλοκες, αόρατες προηγουμένως διαδρομές με εμπόδια σε πραγματικές συνθήκες.

Η δημιουργία ευέλικτων ρομπότ είναι δύσκολη λόγω της εγγενούς πολυπλοκότητας του πραγματικού κόσμου, του περιορισμένου όγκου δεδομένων που μπορούν να συλλέξουν τα ρομπότ και της ταχύτητας με την οποία πρέπει να λαμβάνονται αποφάσεις για την πραγματοποίηση δυναμικών κινήσεων.

Εταιρείες όπως η Boston Dynamics έχουν δημοσιεύσει τακτικά βίντεο με τα ρομπότ τους να κάνουν τα πάντα από Parkour προς την χορευτικές ρουτίνες. Αλλά όσο εντυπωσιακά κι αν είναι αυτά τα κατορθώματα, συνήθως περιλαμβάνουν ανθρώπους που προγραμματίζουν επίπονα κάθε βήμα ή εκπαιδεύονται στα ίδια εξαιρετικά ελεγχόμενα περιβάλλοντα ξανά και ξανά.

Αυτή η διαδικασία περιορίζει σοβαρά τη δυνατότητα μεταφοράς δεξιοτήτων στον πραγματικό κόσμο. Αλλά τώρα, ερευνητές από το ETH Zurich στην Ελβετία χρησιμοποίησαν μηχανική μάθηση για να διδάξουν στον ρομπότ σκύλο τους ANYmal μια σειρά από βασικές δεξιότητες ατμομηχανής που μπορεί στη συνέχεια να συνδυάσει για να αντιμετωπίσει μια μεγάλη ποικιλία απαιτητικών μαθημάτων με εμπόδια, τόσο σε εσωτερικούς όσο και σε εξωτερικούς χώρους, με ταχύτητες έως 4.5 μίλια την ώρα.

«Η προτεινόμενη προσέγγιση επιτρέπει στο ρομπότ να κινείται με πρωτοφανή ευελιξία», γράφουν οι συγγραφείς μιας νέας εργασίας για την έρευνα στο Επιστήμη Ρομποτική. «Μπορεί πλέον να εξελιχθεί σε περίπλοκες σκηνές όπου πρέπει να σκαρφαλώσει και να πηδήξει πάνω σε μεγάλα εμπόδια επιλέγοντας ένα μη τετριμμένο μονοπάτι προς την τοποθεσία-στόχο του».

[Ενσωματωμένο περιεχόμενο]

Για να δημιουργήσουν ένα ευέλικτο αλλά ικανό σύστημα, οι ερευνητές χώρισαν το πρόβλημα σε τρία μέρη και ανέθεσαν ένα νευρωνικό δίκτυο σε καθένα. Αρχικά, δημιούργησαν μια μονάδα αντίληψης που λαμβάνει στοιχεία από κάμερες και lidar και τα χρησιμοποιεί για να δημιουργήσει μια εικόνα του εδάφους και τυχόν εμποδίων σε αυτό.

Το συνδύασαν με μια μονάδα κίνησης που είχε μάθει έναν κατάλογο δεξιοτήτων που σχεδιάστηκε για να το βοηθήσει να διασχίσει διάφορα είδη εμποδίων, όπως το άλμα, το σκαρφάλωμα, το κατέβασμα και το σκύψιμο. Τέλος, συγχώνευσαν αυτές τις μονάδες με μια μονάδα πλοήγησης που θα μπορούσε να χαράξει μια πορεία μέσα από μια σειρά από εμπόδια και να αποφασίσει ποιες δεξιότητες θα επικαλεστούν για να τα ξεπεράσουν.

«Αντικαθιστούμε το τυπικό λογισμικό των περισσότερων ρομπότ με νευρωνικά δίκτυα», είπε ο Nikita Rudin, ένας από τους συγγραφείς της εργασίας, μηχανικός στη Nvidia και διδακτορικός φοιτητής στο ETH Zurich, είπε New Scientist. «Αυτό επιτρέπει στο ρομπότ να επιτύχει συμπεριφορές που δεν ήταν δυνατές διαφορετικά».

Μία από τις πιο εντυπωσιακές πτυχές της έρευνας είναι το γεγονός ότι το ρομπότ εκπαιδεύτηκε στην προσομοίωση. Ένα σημαντικό σημείο συμφόρησης στη ρομποτική είναι η συλλογή αρκετών πραγματικών δεδομένων από τα οποία μπορούν να μάθουν τα ρομπότ. Οι προσομοιώσεις μπορούν βοηθούν στη συλλογή δεδομένων πολύ πιο γρήγορα βάζοντας πολλά εικονικά ρομπότ σε δοκιμές παράλληλα και με πολύ μεγαλύτερη ταχύτητα από ό,τι είναι δυνατό με τα φυσικά ρομπότ.

Αλλά η μετάφραση των δεξιοτήτων που αποκτήθηκαν στην προσομοίωση στον πραγματικό κόσμο είναι δύσκολη λόγω του αναπόφευκτου χάσματος μεταξύ απλών εικονικών κόσμων και του εξαιρετικά πολύπλοκου φυσικού κόσμου. Η εκπαίδευση ενός ρομποτικού συστήματος που μπορεί να λειτουργεί αυτόνομα σε αόρατα περιβάλλοντα τόσο σε εσωτερικούς όσο και σε εξωτερικούς χώρους είναι ένα σημαντικό επίτευγμα.

Η εκπαιδευτική διαδικασία βασίστηκε καθαρά στην ενισχυτική μάθηση - ουσιαστικά δοκιμή και λάθος - και όχι σε ανθρώπινες επιδείξεις, γεγονός που επέτρεψε στους ερευνητές να εκπαιδεύσουν το μοντέλο AI σε έναν πολύ μεγάλο αριθμό τυχαιοποιημένων σεναρίων αντί να πρέπει να επισημάνουν το καθένα χειροκίνητα.

Ένα άλλο εντυπωσιακό χαρακτηριστικό είναι ότι τα πάντα τρέχουν σε τσιπ που είναι εγκατεστημένα στο ρομπότ, αντί να βασίζονται σε εξωτερικούς υπολογιστές. Και εκτός από το ότι ήταν σε θέση να αντιμετωπίσουν μια ποικιλία διαφορετικών σεναρίων, οι ερευνητές έδειξαν ότι ο ANYmal μπορούσε να συνέλθει από πτώσεις ή γλιστρήματα για να ολοκληρώσει την πορεία με εμπόδια.

Οι ερευνητές λένε ότι η ταχύτητα και η προσαρμοστικότητα του συστήματος υποδηλώνουν ότι τα ρομπότ που έχουν εκπαιδευτεί με αυτόν τον τρόπο θα μπορούσαν κάποια μέρα να χρησιμοποιηθούν για αποστολές έρευνας και διάσωσης σε απρόβλεπτα, δύσκολα στην πλοήγηση περιβάλλοντα, όπως ερείπια και κτίρια που έχουν καταρρεύσει.

Ωστόσο, η προσέγγιση έχει περιορισμούς. Το σύστημα εκπαιδεύτηκε για να αντιμετωπίζει συγκεκριμένα είδη εμποδίων, ακόμη και αν διέφεραν σε μέγεθος και διαμόρφωση. Για να λειτουργήσει σε πιο αδόμητα περιβάλλοντα θα απαιτούσε πολύ περισσότερη εκπαίδευση σε πιο διαφορετικά σενάρια για την ανάπτυξη μιας ευρύτερης παλέτας δεξιοτήτων. Και αυτή η εκπαίδευση είναι τόσο περίπλοκη όσο και χρονοβόρα.

Ωστόσο, η έρευνα είναι μια ένδειξη ότι τα ρομπότ γίνονται όλο και πιο ικανά λειτουργίας σε πολύπλοκα, πραγματικού κόσμου περιβάλλοντα. Αυτό υποδηλώνει ότι θα μπορούσαν σύντομα να είναι μια πολύ πιο ορατή παρουσία παντού γύρω μας.

Image Credit: ETH Zurich

spot_img

Τελευταία Νοημοσύνη

spot_img