Обучение с подкреплением Python Keras

Обучение с подкреплением на Python с библиотекой Keras

Статья о том, как научить машинку участвовать в гонке, а персонажей — избегать файерболов. При этом агент способен научиться играть в игру в своем собственном «воображении. В статье — пример обучения…
atari

Эволюционные алгоритмы способны превзойти глубокое обучение в видеоиграх

Учёные использовали генетический алгоритм чтобы обучить компьютер играть в аркады Atari. Суть подхода в том, что для решения задачи изначально генерируется любой код, который затем изменяется с помощью случайных мутаций.…
Dota2

ИИ от OpenAI победил полупрофессионалов в Dota 2

Команда из пяти нейронных сетей, OpenAI Five, начала побеждать любительские и полупрофессиональные команды в Dota 2. В основе алгоритма — расширенная версия Proximal Policy Optimization, работающая на 256 графических процессорах…