Logo Zephyrnet

Máy học đảm bảo hiệu suất của robot trong lãnh thổ không xác định

Ngày:

Một chiếc máy bay không người lái nhỏ thực hiện chuyến bay thử nghiệm qua một không gian chứa đầy các hình trụ các tông được đặt ngẫu nhiên đóng vai trò như giá đỡ cho cây cối, con người hoặc công trình kiến ​​trúc. Thuật toán điều khiển máy bay không người lái đã được đào tạo trên hàng nghìn khóa học mô phỏng đầy chướng ngại vật, nhưng chưa bao giờ thấy một thuật toán nào như thế này. Tuy nhiên, chín lần trong số 10 lần, chiếc máy bay cỡ pint tránh được tất cả các chướng ngại vật trên đường đi của nó.

Thử nghiệm này là cơ sở chứng minh cho một thách thức quan trọng trong lĩnh vực robot hiện đại: khả năng đảm bảo sự an toàn và thành công của các robot tự động hoạt động trong môi trường mới. Khi các kỹ sư ngày càng chuyển sang sử dụng các phương pháp học máy để phát triển các robot thích ứng, công trình mới của các nhà nghiên cứu tại Đại học Princeton đã tạo ra tiến bộ về những đảm bảo như vậy cho robot trong các bối cảnh có nhiều loại trở ngại và khó khăn khác nhau.

“Trong khoảng hơn một thập kỷ qua, có rất nhiều sự phấn khích và tiến bộ xung quanh việc học máy trong bối cảnh của người máy, chủ yếu là vì nó cho phép bạn xử lý các đầu vào cảm giác phong phú, giống như từ camera của robot và lập bản đồ các đầu vào phức tạp này Anirudha Majumdar, một trợ lý giáo sư về kỹ thuật cơ khí và hàng không tại Princeton cho biết.

Tuy nhiên, các thuật toán điều khiển rô bốt dựa trên máy học có nguy cơ trang bị quá mức cho dữ liệu đào tạo của chúng, điều này có thể làm cho các thuật toán kém hiệu quả hơn khi chúng gặp phải các đầu vào khác với đầu vào mà chúng đã được đào tạo. Phòng thí nghiệm chuyển động robot thông minh của Majumdar đã giải quyết thách thức này bằng cách mở rộng bộ công cụ có sẵn để đào tạo các chính sách điều khiển robot và định lượng khả năng thành công và độ an toàn của robot hoạt động trong môi trường mới.

Trong ba bài báo mới, các nhà nghiên cứu đã điều chỉnh các khuôn khổ học máy từ các lĩnh vực khác cho lĩnh vực vận động và thao tác robot. Họ chuyển sang lý thuyết tổng quát hóa, lý thuyết thường được sử dụng trong các ngữ cảnh ánh xạ một đầu vào thành một đầu ra, chẳng hạn như gắn thẻ hình ảnh tự động. Các phương pháp mới là một trong những phương pháp đầu tiên áp dụng lý thuyết tổng quát hóa cho nhiệm vụ phức tạp hơn là đảm bảo hiệu suất của rô-bốt trong các môi trường không quen thuộc. Majumdar cho biết: Trong khi các phương pháp tiếp cận khác cung cấp các đảm bảo như vậy dưới các giả định hạn chế hơn, các phương pháp của nhóm cung cấp các đảm bảo áp dụng rộng rãi hơn về hiệu suất trong các môi trường mới.

Trong bài báo đầu tiên, một bằng chứng về nguyên tắc để áp dụng các khuôn khổ học máy, nhóm đã thử nghiệm phương pháp tiếp cận của họ trong các mô phỏng bao gồm một chiếc xe có bánh lái qua một không gian đầy chướng ngại vật và một cánh tay rô bốt nắm lấy đồ vật trên bàn. Họ cũng xác nhận kỹ thuật này bằng cách đánh giá khả năng tránh chướng ngại vật của một máy bay không người lái nhỏ gọi là Parrot Swing (một máy bay quadcopter kết hợp và máy bay cánh cố định) khi nó bay xuống một hành lang dài 60 foot rải rác bằng các trụ các tông. Tỷ lệ thành công được đảm bảo của chính sách điều khiển máy bay không người lái là 88.4% và nó đã tránh được các trở ngại trong 18 trong số 20 thử nghiệm (90%).

Tác phẩm, được xuất bản ngày 3 tháng XNUMX trong Tạp chí Nghiên cứu Robot Quốc tế, được đồng ủy quyền bởi Majumdar; Alec Farid, một sinh viên tốt nghiệp ngành kỹ thuật cơ khí và hàng không vũ trụ; và Anoopkumar Sonar, một bộ tập trung khoa học máy tính từ Lớp học năm 2021 của Princeton.

Farid cho biết khi áp dụng các kỹ thuật máy học từ các lĩnh vực khác vào chế tạo người máy, “có rất nhiều giả định đặc biệt mà bạn cần phải thỏa mãn và một trong số đó là cho biết các môi trường mà bạn mong đợi sẽ thấy giống với các môi trường mà chính sách của bạn đã từng Huân luyện vê. Ngoài việc cho thấy rằng chúng tôi có thể làm được điều này trong môi trường robot, chúng tôi cũng tập trung vào việc cố gắng mở rộng các loại môi trường mà chúng tôi có thể cung cấp sự đảm bảo cho nó. ”

“Các loại đảm bảo mà chúng tôi có thể đưa ra từ khoảng 80% đến 95% tỷ lệ thành công trên môi trường mới, tùy thuộc vào nhiệm vụ cụ thể, nhưng nếu bạn đang triển khai [một phương tiện bay không người lái] trong môi trường thực, thì 95 Có lẽ% không đủ tốt, ”Majumdar nói. “Tôi thấy đó là một trong những thách thức lớn nhất và là một trong những thách thức mà chúng tôi đang tích cực giải quyết”.

Hongkai Dai, một nhà khoa học nghiên cứu cấp cao tại Viện Nghiên cứu Toyota ở Los Altos, California, cho biết, các phương pháp tiếp cận của nhóm vẫn thể hiện sự tiến bộ cần thiết trong việc đảm bảo tổng quát hóa cho các robot hoạt động trong môi trường không nhìn thấy.

Dai, người không tham gia nghiên cứu cho biết: “Những đảm bảo này là tối quan trọng đối với nhiều ứng dụng quan trọng về an toàn, chẳng hạn như ô tô tự lái và máy bay không người lái tự hành, nơi mà bộ đào tạo không thể bao gồm mọi tình huống có thể xảy ra”. “Sự đảm bảo cho chúng ta biết khả năng một chính sách vẫn có thể hoạt động tốt một cách hợp lý trong những trường hợp không nhìn thấy được và do đó thiết lập niềm tin vào chính sách, khi tỷ lệ thất bại là quá cao.”

Trong hai bài báo khác, sẽ được trình bày vào ngày 18 tháng XNUMX tại Hội nghị ảo về Robot học, các nhà nghiên cứu đã kiểm tra các cải tiến bổ sung để đưa các chính sách điều khiển robot gần hơn với những đảm bảo cần thiết cho việc triển khai trong thế giới thực. Một bài báo sử dụng phương pháp học bắt chước, trong đó “chuyên gia” của con người cung cấp dữ liệu đào tạo bằng cách hướng dẫn thủ công một robot mô phỏng nhặt các đồ vật khác nhau hoặc di chuyển qua các không gian khác nhau có chướng ngại vật. Cách tiếp cận này có thể cải thiện sự thành công của các chính sách kiểm soát dựa trên máy học.

Để cung cấp dữ liệu đào tạo, tác giả chính Allen Ren, một sinh viên tốt nghiệp ngành cơ khí và hàng không vũ trụ, đã sử dụng chuột máy tính 3D để điều khiển một cánh tay robot mô phỏng có nhiệm vụ cầm và nâng các cốc uống có kích thước, hình dạng và vật liệu khác nhau. Các thí nghiệm học bắt chước khác liên quan đến cánh tay đẩy một chiếc hộp qua bàn và mô phỏng một robot có bánh xe di chuyển xung quanh đồ nội thất trong một môi trường giống như ở nhà.

Các nhà nghiên cứu đã triển khai các chính sách học được từ các nhiệm vụ cầm cốc và đẩy hộp trên một cánh tay robot trong phòng thí nghiệm, có thể lấy 25 cốc khác nhau bằng cách nắm lấy vành của chúng giữa hai cái kẹp giống như ngón tay - không cầm tay cầm như một con người sẽ. Trong ví dụ về đẩy hộp, chính sách này đạt được 93% thành công đối với các nhiệm vụ dễ hơn và 80% đối với các nhiệm vụ khó hơn.

Ren nói: “Chúng tôi có một chiếc máy ảnh trên bàn để quan sát môi trường và chụp ảnh năm lần mỗi giây. “Mô phỏng đào tạo chính sách của chúng tôi lấy hình ảnh này và xuất ra loại hành động mà robot sẽ thực hiện, sau đó chúng tôi có bộ điều khiển di chuyển cánh tay đến các vị trí mong muốn dựa trên kết quả đầu ra của mô hình.”

Bài báo thứ ba đã chứng minh sự phát triển của các nhà lập kế hoạch dựa trên tầm nhìn cung cấp sự đảm bảo cho các robot bay hoặc đi bộ thực hiện các chuỗi chuyển động theo kế hoạch thông qua các môi trường đa dạng. Việc tạo ra các chính sách kiểm soát cho các chuyển động theo kế hoạch đã mang đến một vấn đề mới về quy mô - nhu cầu tối ưu hóa các chính sách dựa trên tầm nhìn với hàng nghìn, thay vì hàng trăm, kích thước.

“Điều đó đòi hỏi phải đưa ra một số công cụ thuật toán mới để có thể xử lý kích thước đó và vẫn có thể đảm bảo tổng quát hóa mạnh mẽ,” tác giả chính Sushant Veer, một cộng sự nghiên cứu sau tiến sĩ về kỹ thuật cơ khí và hàng không vũ trụ cho biết.

Một khía cạnh quan trọng trong chiến lược của Veer là việc sử dụng các nguyên tắc chuyển động, trong đó một chính sách chỉ đạo robot đi thẳng hoặc rẽ, thay vì chỉ định mô-men xoắn hoặc vận tốc cho mỗi chuyển động. Ông Majumdar nói, việc thu hẹp không gian của các hành động có thể làm cho quá trình lập kế hoạch trở nên dễ tính toán hơn.

Veer và Majumdar đã đánh giá các nhà lập kế hoạch dựa trên tầm nhìn dựa trên mô phỏng của một máy bay không người lái điều hướng xung quanh chướng ngại vật và một robot bốn chân băng qua địa hình gồ ghề với độ dốc cao tới 35 độ - “một vấn đề rất thách thức mà rất nhiều người trong ngành chế tạo robot vẫn đang cố gắng thực hiện Veer nói.

Trong nghiên cứu, robot có chân đạt tỷ lệ thành công 80% trên các môi trường thử nghiệm không nhìn thấy. Các nhà nghiên cứu đang làm việc để cải thiện hơn nữa các đảm bảo chính sách của họ, cũng như đánh giá hiệu suất của các chính sách trên các robot thực trong phòng thí nghiệm.

Công trình đã được hỗ trợ một phần bởi Văn phòng Nghiên cứu Hải quân Hoa Kỳ, Quỹ Khoa học Quốc gia, Giải thưởng Nghiên cứu Khoa học của Google và Giải thưởng Nghiên cứu của Amazon.

Nguồn: https://www.scTHER Daily.com/release/2020/11/201117144546.htm

tại chỗ_img

Tin tức mới nhất

tại chỗ_img