Учёные из Университета Карнеги-Меллона (США) заставили робота освоить самостоятельное обучение по захватыванию манипулятором различных объектов.

Робот Baxter обладает классической для многоцелевого промышленного робота компоновкой из двух манипуляторов. Он управляется операционной системой для роботов (ROS) с открытым исходным кодом, благодаря чему учёные часто выбирают его для исследовательских проектов с машинным обучением.

Для обучения Baxter обращению с предметами с помощью нейронных сетей учёные заполнили стол перед роботом различными объектами вроде бутылки, пульта управления телевизором или игрушечного пистолета. Робот выбирал из кучи предметов один, откладывал его, определял наиболее выгодную точку захвата и пытался взять с разных сторон.

Для каждой выбранной точки захвата Baxter выполнял 188 попыток взять предмет. В случае неудачи робот поворачивал манипулятор на 10 градусов и пытался снова. После окончания первой стадии обучения учёные повторяли цикл с новым набором предметов, из которых лишь некоторые были знакомы роботу.

На обучение ушло 700 часов, в течение которых Baxter учился поднимать предметы со стола. Если он ронял предмет, то переходил к следующему, а всего за время обучения удалось выполнить около 50 тысяч захватов разных объектов на столе.

В результате машинного обучения точность выбора позиции манипулятора для захвата составила около 80%. Методика может пригодиться для использования роботов в сложных условиях, где требуется умение адаптироваться к окружающей среде и условиям задачи.