PHYRE: как обучить RL-агента решать физические задачи

16 августа 2019

PHYRE: как обучить RL-агента решать физические задачи

PHYRE — это 2D-симулятор с 50 видами физических головоломок для обучения RL-агентов. Всего в симуляторе 5 тысяч головоломок. Задачи были разработаны исследователями из Facebook AI. Несмотря на то, что головоломки…

Нейросеть заполняет отсутствующие фрагменты в видеозаписи

14 августа 2019

Нейросеть заполняет отсутствующие фрагменты в видеозаписи

Исследователи использовали предсказание оптического потока для заполнения отсутствующих фрагментов в видеозаписи. Метод был протестирован на задачах DAVIS и YouTubeVOS. Модель получила state-of-the-art результаты по скорости обучения и качеству предсказаний. Оптический…

Обновления: PyTorch 1.2, torchtext 0.4, torchaudio 0.3 и torchvision 0.4

14 августа 2019

Обновления: PyTorch 1.2, torchtext 0.4, torchaudio 0.3 и torchvision 0.4

Вышли обновления для библиотеки PyTorch и дополнительных библиотек для обработки текста, аудио и изображений. В PyTorch добавился модуль с трансформером, в torchaudio — новые способы трансформации и стандартизации аудиоданных, в…

DeepMind опубликовали библиотеку для RL экспериментов

14 августа 2019
deepmind maths challenge

DeepMind опубликовали библиотеку для RL экспериментов

bsuite — это коллекция экспериментов для исследования поведения разных RL-агентов на общих задачах. Библиотека автоматизирует оценку и анализ поведения агентов на задачах. Она служит для упрощения создания повторяемых исследований. У…

В Nvidia обучили языковую модель с 8 миллиардами параметров

14 августа 2019

В Nvidia обучили языковую модель с 8 миллиардами параметров

MegatronLM — это языковая модель с 8.3 миллиардами параметров, которую в Nvidia обучили на 512 GPU. MegatronLM основывается на GPT-2. По размеру MegatronLM больше BERT в 24 раза и больше…

SelFlow: модель предсказывает передвижения объектов на видео

13 августа 2019

SelFlow: модель предсказывает передвижения объектов на видео

SelFlow — это нейросетевая модель, которая предсказывает последовательность передвижений объекта на видеозаписи. Нейросеть обучается как с учителем, так и без. По точности предсказаний SelFlow обходит state-of-the-art алгоритмы на 4-х задачах. …

Как конвертировать модель из TensorFlow в PyTorch

13 августа 2019

Как конвертировать модель из TensorFlow в PyTorch

Разработчики из HuggingFace опубликовали тьюториал по конвертированию предобученных моделей из TensorFlow в PyTorch. Это может пригодиться при попытке внедрить предобученную модель на TF в пайплайн на PyTorch. В качестве примера…

TCC: нейросеть накладывает звук на видеозапись

13 августа 2019

TCC: нейросеть накладывает звук на видеозапись

Temporal Cycle-Consistency Learning (TCC) — это алгоритм для распознавания действий на видеозаписи. TCC обучается self-supervised. Одно из применений алгоритма — перенос звука с одной видеозаписи на другую. Код нейросети доступен…

Модель от FAIR для представления слов устойчива к опечаткам

12 августа 2019

Модель от FAIR для представления слов устойчива к опечаткам

Facebook AI Research опубликовали новую модель для обучения представлений слов, — MOE. Misspelling Oblivious Embeddings (MOE) комбинирует в себе модель fastText и задачу по подбору наиболее близкого слова к слову…

Как сократить размер BERT без значительной потери в точности

12 августа 2019

Как сократить размер BERT без значительной потери в точности

BERT — это одна из state-of-the-art моделей в обработке естественного языка. Несмотря на качество модели, обучение BERT является ресурсоемким как по памяти, так и по скорости обучения. Исследователи из RASA…

Нейросеть генерирует аниме-персонажа из изображения

11 августа 2019

Нейросеть генерирует аниме-персонажа из изображения

U-GAT-IT — это генеративная нейросеть для синтезации изображений, которая обучается без учителя. Разработчики протестировали ее работу на задаче генерации изображений аниме-персонажей из обычных фотографий людей. Результаты экспериментов показывают, что U-GAT-IT…

F2ED: датасет для распознавания эмоций на лице

8 августа 2019

F2ED: датасет для распознавания эмоций на лице

F2ED — это датасет с размеченными изображениями человеческих лиц. Датасет предназначен для решения задачи end-to-end распознавания эмоций по данным с камер слежения. Данные собирались исследователями из Fudan University и Ping…

Нейросеть реконструировала строение мозга мухи в 3D

7 августа 2019

Нейросеть реконструировала строение мозга мухи в 3D

Исследователи из Google AI разработали нейросеть, которая воссоздала структуру мозга мухи в 3D. В качестве архитектуры были использованы Flood-Filling нейросети. Neuroglancer — это 3D-интерфейс для изучения структуры мозга мухи, который…

Tensorpack: быстрый интерфейс для обучения нейросетей на TensorFlow

28 июля 2019

Tensorpack: быстрый интерфейс для обучения нейросетей на TensorFlow

Tensorpack — это интерфейс для обучения нейронных моделей, который основан на TensorFlow. Обучение моделей на Tensorpack занимает в 1.2-5 раза меньше времени, чем на Keras, оригинальной высокоуровневой библиотеке на TensorFlow. …

Gated-SCNN: новый state-of-the-art в семантической сегментации

28 июля 2019

Gated-SCNN: новый state-of-the-art в семантической сегментации

Gated-SCNN — это двухпоточная сверточная нейросеть для семантической сегментации изображений. GSCNN обходит state-of-the-art архитектуры на 2-4% на задаче Cityscapes. Архитектура была разработана исследователями из NVIDIA. Текущие state-of-the-art методы для сегментации…

VSCO использует машинное обучение для рекомендации фильтров

28 июля 2019

VSCO использует машинное обучение для рекомендации фильтров

VSCO — одно из наиболее популярных мобильных приложений для обработки фото. Приложение помогает выбирать подходящие фильтры к фотографии с помощью сверточных нейросетей. Разработчики используют машинное обучения для рекомендации пресетов. Пресеты…

Green AI: как обучать нейросети без вреда окружающей среде

28 июля 2019

Green AI: как обучать нейросети без вреда окружающей среде

В Allen Institute for AI опубликовали инициативу Green AI. Green AI фокусируется на оптимизации ресурсов для глубокого обучения. Количество вычислений, которые требуются для обучения нейросетевых моделей, растет в два раза…

Нейросеть учится отвечать на открытые вопросы

28 июля 2019

Нейросеть учится отвечать на открытые вопросы

Facebook AI представили новую задачу по обработке естественного языка — ответы на открытые вопросы. Исследователи выложили в открытый доступ данные, код и результаты базовых моделей. Чтобы поспособствовать развитию умных ассистентов…

ImageNet-A: как снизить точность предсказаний нейросети на 90%

27 июля 2019

ImageNet-A: как снизить точность предсказаний нейросети на 90%

ImageNet-A — это датасет с примерами изображений, которые нейросеть не может классифицировать верно. По результатам, модели предсказывали объекты из датасета с точностью в 3%. В то время как для стандартного…

Как использовать эволюционные алгоритмы для обучения беспилотных автомобилей

27 июля 2019

Как использовать эволюционные алгоритмы для обучения беспилотных автомобилей

Исследователи из DeepMind совместно с Waymo применили алгоритм естественного отбора для подбора параметров модели, распознающей пешеходов на дороге. Использование эволюционного обучения сократило процент ложно распознанных объектов на 24%. Чтобы сделать…

Нейросеть от Facebook размечает спутниковые снимки местности

27 июля 2019

Нейросеть от Facebook размечает спутниковые снимки местности

Исследователи в Facebook AI разработали нейросеть, которая размечает дороги на спутниковых снимках. Map With AI — это инструмент для проверки разметки, которую сделала нейросеть. Модель разметила ранее не размеченные дороги…