Как делать аугментацию данных для задачи распознавания объектов

29 июня 2019

Как делать аугментацию данных для задачи распознавания объектов

Исследователи из Google Brain разработали метод поиска оптимальной обработки изображений перед обучением модели. Расширение данных с помощью методов аугментации увеличивает точность модели — на 2.3 пункта для COCO и на…

OFC: новый метод для поиска архитектуры модели от Google AI

26 июня 2019

OFC: новый метод для поиска архитектуры модели от Google AI

В Google AI разработали новый метод подбора модели обучения с подкреплением. Использование метода сокращает количество моделей для тестирования в реальных экспериментах.  Обучение с подкреплением — это такая группа алгоритмов, в…

Google Research Football: новая среда для обучения RL-агентов

10 июня 2019

Google Research Football: новая среда для обучения RL-агентов

Google AI опубликовали новую задачу для тренировки алгоритмов обучения с подкреплением (RL). Агенты будут учиться играть в футбол. Обучения с подкреплением фокусируется на задаче обучить агентов взаимодействовать со средой, в…

DeepMind обучили агентов играть в многопользовательскую игру на уровне человека

1 июня 2019

DeepMind обучили агентов играть в многопользовательскую игру на уровне человека

Исследователи из DeepMind обучили мультиагентную систему, которая играет в Quake III Arena: Capture The Flag так же хорошо, как человек. Методы обучения с подкреплением (RL) показывают хорошие результаты в случае…

MineRL: датасет с демонстрациями игры в Minecraft для решения RL задач

13 мая 2019

MineRL: датасет с демонстрациями игры в Minecraft для решения RL задач

Исследователи из Microsoft, CMU и других университетов опубликовали датасет с записями игр в Minecraft. Соревнование открывается 1-го июня и длится до 25-го октября. Участникам предлагается обучить модель, которая сумела бы…

OpenAI дает возможность побороться с OpenAI Five в Dota 2

16 апреля 2019
dota 2 open ai five

OpenAI дает возможность побороться с OpenAI Five в Dota 2

В четверг OpenAI на три дня откроет доступ к платформе для игры в Dota 2 против OpenAI Five, который на прошлых выходных победил профессиональную киберспортивную команду OG. Исследователи отмечают, что…

Обучение с подкреплением применили для настройки протеза ноги

1 февраля 2019

Обучение с подкреплением применили для настройки протеза ноги

Роботизированный протез обычно настраивается вручную. Инженеры тратят часы, чтобы отрегулировать каждое соединение и адаптировать его к особенностям ходьбы конкретного человека. Метод автоматической настройки протеза c помощью обучения с подкреплением позволяет человеку…

Робот Nvidia учится убираться и готовить на кухне IKEA

17 января 2019
nvidia роборука на кухне IKEA

Робот Nvidia учится убираться и готовить на кухне IKEA

Nvidia открывает новую робототехническую лабораторию в Сиэтле, чтобы сделать роботов более умными и эффективными. В качестве обучающей площадки компания выбрала стандартную кухню IKEA. Промышленные роботы пока ещё глупы и опасны,…

OpenAI вычисляют идеальный batch size для обучения моделей

20 декабря 2018
gradient-noise-open-ai-batch-size

OpenAI вычисляют идеальный batch size для обучения моделей

Разработчики OpenAI представили исследование, которое показывает, что можно определить идеальный размер пакета данных для обучения алгоритмов, основываясь на данных шкалы градиентного шума. Метод позволит сократить время и стоимость обучения. В…

Ботов научили самостоятельно одеваться, используя обучение с подкреплением

16 ноября 2018

Ботов научили самостоятельно одеваться, используя обучение с подкреплением

Ученые из Технологического Института Джорджии научили анимационных персонажей одеваться самостоятельно. Боты умеют надевать виртуальные футболки и куртки, а также одеваться с помощью ассистента. Технология поможет создавать реалистичную компьютерную графику и…

Обучение с подкреплением на Python с библиотекой Keras

14 августа 2018
Обучение с подкреплением Python Keras

Обучение с подкреплением на Python с библиотекой Keras

Статья о том, как научить машинку участвовать в гонке с помощью обучения с подкреплением, а персонажей — избегать файерболов. При этом агент способен научиться играть в игру в своем собственном «воображении».…