Разработчики из Кембриджского университета научили Renault Twizys автономному движению, используя глубкое обучение с подкреплением. Водитель передавал полное управление машиной автопилоту, не объясняя, какую задачу нужно выполнять, позволив ему экспериментировать. В основе алгоритма — свёрточная нейронная сеть, которая использовала в качестве входных данных изображение из камеры и анализировала его в реальном времени.
Когда машина съезжала с дороги, водитель останавливал и исправлял её. За 20 минут и 20 экспериментов, автомобиль научился ехать относительно ровно.