Open AI научила роборуку манипулировать кубом с помощью искусственного интеллекта. Теперь робот может свободно перемещать объект в разных направлениях почти как человек: рука способна повернуть куб 50 раз и не уронить его. Средний результат других подобных разработок — 13 последовательных перемещений.
Для обучения ИИ управлению рукой учёные использовали метод обучения с подкреплением. Исследователи создали симуляцию, которая помогла алгоритму понять, как этот процесс происходил бы в реальном мире. Разработчики меняли размер и цвета куба, делали поверхность скользкой, изменяли силу тяжести, добавляли визуальные шумы и другие вариации, чтобы робот учился справляться с неожиданными сценариями. После обучения искусственного интеллекта на симуляторе, информацию загрузили в механизмы управления рукой. С помощью камер алгоритм понимал, что происходит с кубом и анализировал как его перемещать.
Dactyl должен был накопить 100 лет опыта, чтобы достичь максимальной производительности. Команде пришлось использовать много вычислительной мощности — 6144 CPU и восемь графических процессоров Nvidia V100.