В исследовании Google AI продемонстрирована возможность обучения роботов выполнению задач, отсутствовавших в обучающем датасете. Метод позволяет ускорить и упростить процесс обучения роботов.
Роботы в реальном мире неизбежно столкнутся с новыми командами и ситуациями, которых не было во время обучения. Поэтому важно, чтобы роботы были способны решать новые для них задачи. Существующие исследования в области робототехники позволили роботам выполнять задачи с новыми объектами, описаниями и целями. Однако предоставление роботам возможности выполнять инструкции, описывающие совершенно новые задачи, в значительной степени остается недоступным.
Система BC-Z, разработанная в Google, состоит из двух ключевых компонентов: сбор крупномасштабного обучающего датасета, охватывающего 100 различных задач, и нейросеть с голосовой командой или видеоинструкцией в качестве входных данных.
В процессе обучения действия робота записывались с помощью гарнитуры виртуальной реальности. Сначала оператор записывает видеоинструкцию по выполнению каждой задачи. Затем, как только робот выучит последовательность действий, робот пытается повторить действия. Если робот начинает ошибаться или застревает, оператор вмешивается и показывает, как исправить ошибку.
Такая смесь демонстраций и вмешательств значительно повышает производительность обучения. В экспериментах Google было зарегистрировано увеличение производительности в 2 раза при использовании данной стратегии сбора данных по сравнению с использованием только демонстраций.
Полученная система смогла выполнить 24 новых задачи, в том числе те, которые требуют взаимодействия с парами объектов, которые ранее не взаимодействовали в обучающем датасете.