Робот осваивает навыки обращения с шариком и ракеткой. Для этого «учителю» необходимо лишь показать ему пример — и после нескольких пробных попыток ученик начинает весьма успешно справляться с поставленной задачей.
Пинг-понг-бот: Прилежный ученик

Программирование роботов для выполнения определенных задач остается непростым делом, несмотря на впечатляющие успехи робототехники. А в непромышленных условиях (в домах, больницах, офисах) ситуация осложняется еще и необходимостью действовать более безопасно в условиях большей неопределенности. Поэтому инженеры стремятся создать роботов, поведение которых будет гибким и адаптивным — роботов, которые, подобно людям, будут учиться на собственном опыте.

Именно эту задачу и решает команда исследователей из Robot Learning Lab (лаборатории, входящей в состав Института Макса Планка, Германия) во главе с Яном Питерсом (Jan Peters). Питерс ставит перед собой цель превратить программирование роботов в обучение. Другими словами, он хочет разработать роботов, каждое движение которых не придется точно просчитывать.

На видео Катарина Мулинг (Katharina Muelling), аспирант Питерса, показывает роботу, как «вести» шарик для пинг-понга, закрепленный на резинке. Робот представляет движения в виде набора базовых «моторных навыков» — и быстро «учится» этому нехитрому трюку. Для сравнения, ученые попытались составить программу для выполнения той же задачи. На это ушло целых три месяца, и результат был не столь хорош, как после «обучения», которое заняло менее часа.

Во второй части видео Мулинг учит робота ловить шарик при помощи чашки. Это гораздо более сложный навык, и роботу для достижения положительного результата недостаточно просто подражать движениям человека. Разница в скорости перемещения руки и манипулятора не позволяет роботу поймать шарик при попытке воспроизвести действия «учителя». И тут, по словам Питерса, на первый план выходит процесс «самосовершенствования». «Каждый раз, когда роботу удается подвести мяч ближе к чашке, он получает «награду», — рассказывает Питерс. В результате «самосовершенствования» на протяжении многих попыток робот осваивает необходимые навыки. Так, первые удачные броски приходятся на 40−45 попытки, а после 90−95 попыток робот добивается стабильного положительного результата.

Какова способность робота к обучению по сравнению с человеком? Этим вопросом задался Йенс Кобер (Jens Kober), один из аспирантов Питерса. В качестве объектов небольшого эксперимента он выбрал своих многочисленных родственников. Оказалось, самые младшие из них (в возрасте до 6 лет) вообще не способны поймать шарик в чашку, те, что чуть постарше (10−12 лет), научились этому за 30−35 попыток, а взрослые справились гораздо быстрее. «Руководитель проекта — пожалуй, единственный человек в лаборатории, кто так и не освоил эту игру», — усмехается д-р Питерс.

В заключительной части видео робот учится игре в пинг-понг. Основная задача здесь состоит в модификации ранее изученных движений в зависимости от визуальной информации (направления полета мяча, выпущенного из подающей машины). Д-р Питерс рассчитывает, что однажды «пинг-понг-бот» если и не станет чемпионом, то, по крайней мере, сможет обыграть всех сотрудников лаборатории.

По сообщению IEEE Spectrum