Команда из пяти нейронных сетей, OpenAI Five, начала побеждать любительские и полупрофессиональные команды в Dota 2. В основе алгоритма — расширенная версия Proximal Policy Optimization, работающая на 256 графических процессорах и 128 000 ядер. Система тренируется каждый день, играя против самой себя и проживая по 180 лет игрового времени. Для каждой нейросети используется отдельная LTSM, которая помогает анализировать окружающую среду и обходить препятствия.
Разработчики планируют провести матч против топ-игроков 28 июля 2018 года, трансляцию можно будет посмотреть на Twitch.