Graph2Diff: нейросеть исправляет ошибки в коде

15 ноября 2019

Graph2Diff: нейросеть исправляет ошибки в коде

Graph2Diff — это графовая нейросеть, которая предлагает исправления для ошибок при сборке программы. Разработкой модели занимались исследователи из Google. Профессиональные программисты тратят значительную часть времени на исправление ошибок при сборке…

Нейросеть выучивает базовые физические законы

14 ноября 2019

Нейросеть выучивает базовые физические законы

Исследователи из Uber AI предложили архитектуру нейросети, которая выучивает физические законы. Модель протестировали на задаче предсказания наблюдений системы массы-пружины. В сравнении с стандартной архитектурой нейросети Гамильтовы нейросети обладают большей обобщающей…

NVIDIA Turing GPU и Xavier установили рекорд по скорости на MLPerf

14 ноября 2019

NVIDIA Turing GPU и Xavier установили рекорд по скорости на MLPerf

MLPerf — это открытая платформа для тестирования оборудования для обучения ML-моделей. Продукты от NVIDIA, — Turing GPU и система Xavier, — заняли первые места на MLPerf Inference 0.5 по скорости…

MLQA: датасет для мультиязычной вопросно-ответной системы

14 ноября 2019

MLQA: датасет для мультиязычной вопросно-ответной системы

MLQA — это датасет для оценки моделей на задаче генерации экстрактивных ответов на вопросы (QA). Датасет был собран для того, чтобы способствовать улучшению и расширению задачи генерации ответов на большее…

Нейросеть восстанавливает изображения по данным ЭЭГ

14 ноября 2019

Нейросеть восстанавливает изображения по данным ЭЭГ

В МФТИ и Neurobotics обучили нейросеть, которая восстанавливает изображение по данным ЭЭГ. Одним из применений нейросети является использование в девайсах для реабилитации после инсульта.  Чтобы разрабатывать устройства, которые контролируются мозгом,…

DialoGPT: в Microsoft GPT-2 обучили генерировать ответы в диалоге

12 ноября 2019

DialoGPT: в Microsoft GPT-2 обучили генерировать ответы в диалоге

DialoGPT — это диалоговая модель, которую обучили на 147 миллионах комментариев в Reddit. Нейросеть генерирует ответы на реплики пользователя (single-turn dialogue). DialoGPT базируется на GPT-2. Обучающая выборка состояла из цепочек…

Какие объекты GAN генерировать не может

9 ноября 2019

Какие объекты GAN генерировать не может

Исследователи из MIT CSAIL изучили, какие объекты генеративным нейросетям сложнее синтезировать. На примере датасета LSUN churches такие классы объектов, как люди, машины и ворота, игнорируются генератором нейросети. Несмотря на успех…

Какие ошибки чаще всего совершают при обучении нейросетей

6 ноября 2019

Какие ошибки чаще всего совершают при обучении нейросетей

Исследователи из USI выделили основные проблемы, с которыми сталкиваются разработчики при обучении нейросетей. Выборка состояла из 1059 проблем и коммитов ML-репозиториев на GitHub, которые были вручную проанализированы. Чтобы валидировать выделенный…

Как обучить трансформер на одном языке и перенести его на другой

1 ноября 2019

Как обучить трансформер на одном языке и перенести его на другой

Исследователи из DeepMind проверили, как предобученный на данных одного языка трансформер переносится на другой язык. Исследователи публикуют новый датасет с кросс-языковыми парами вопросов и ответов (XQuAD). Датасет состоит из 240…

CBNet: нейросетевая архитектура для распознавания объектов

1 ноября 2019

CBNet: нейросетевая архитектура для распознавания объектов

В существующих детекторах, которые основываются на сверточных нейросетях, основная сеть архитектуры играет важную роль. Выбор основной сети архитектуры (backbone network) влияет на качество модели. Исследователи предлагают улучшить качество модели с…

NLP модели на TensorFlow 2.0 в 10 строк кода

1 ноября 2019

NLP модели на TensorFlow 2.0 в 10 строк кода

Transformers — это библиотека на Python для обучения state-of-the-art моделей в обработке естественного языка. Разработкой библиотеки занимается компания HuggingFace. Transformers предоставляет API для использования таких архитектур трансформеров, как BERT, RoBERTa,…

SGD: датасет с диалогами для обучения персональных ассистентов

1 ноября 2019

SGD: датасет с диалогами для обучения персональных ассистентов

В Google AI опубликовали датасет с диалогами для обучения персональных ассистентов. Schema-Guided Dataset (SGD) состоит из 18 тысяч размеченных разговоров между пользователем и персональным ассистентом. В датасете обеспечивается разнообразие тем…

Gradient: инструмент для обучения ML моделей на GPU

1 ноября 2019

Gradient: инструмент для обучения ML моделей на GPU

Компания Paperspace опубликовала инструмент для обучения ML алгоритмов на бесплатных GPU. Gradient Community Notebooks — это бесплатный облачный GPU сервис, который основан на Jupyter ноутбуках.  Настройка и поддержка окружения для…

SlowFast: архитектура для распознавания действий на видео

1 ноября 2019

SlowFast: архитектура для распознавания действий на видео

SlowFast — это нейросетевая архитектура, которая адаптирована для классификации действий на видео. Модель одновременно обрабатывает видео на высокой и низкой кадровой частоте. Нейросеть использует два канала обработки данных: первый фокусируется…

Мультиагентная RL-система получила титул Грандмастера в StarCraft II

1 ноября 2019

Мультиагентная RL-система получила титул Грандмастера в StarCraft II

Модель AlphaStar от DeepMind обучилась играть в StarCraft II на уровне Грандмастера. В общем рейтинге модель обошла 99.8% активных игроков. Уровень Грандмастера был достигнут для всех трех типов игроков: Protoss,…

Модель от FAIR учится действиям по видеозаписям

1 ноября 2019

Модель от FAIR учится действиям по видеозаписям

Исследователи из FAIR разработали модель, которая обучается взаимодействовать с объектами по видеозаписям. Модель обучалась на видео обыденных действий людей. По результатам экспериментов, модель либо повторяла, либо обходила state-of-the-art алгоритмы. Преимущество…

CAVIN: алгоритм для планирования многоступенчатых задач

31 октября 2019

CAVIN: алгоритм для планирования многоступенчатых задач

Исследователи из Stanford разработали модель для решения многоступенчатых задач. CAVIN выдает последовательность действий для целевой задачи. Чтобы оценить работу модели, алгоритм встроили в робота. Роботу дали решать три задачи: уборка,…

TensorMask: instance сегментация плотно расположенных объектов

30 октября 2019

TensorMask: instance сегментация плотно расположенных объектов

TensorMask — это алгоритм instance сегментации для распознавания плотно расположенных объектов на изображении. Нейросеть использует метод скользящего окна для сегментации объектов. Разработкой алгоритма занимались исследователи из FAIR. По результатам экспериментов,…

GAN переносит выражение животного на других животных

30 октября 2019

GAN переносит выражение животного на других животных

Разработчики из NVIDIA опубликовали GAN, которая генерирует изображения животных на основе выражения и позы животного на входном изображении. Приложение GANimal позволяет загрузить фото животного. Нейросеть переносит выражение и позу животного…

C3DPO: нейросеть генерирует 3D модель объекта по размеченному изображению

29 октября 2019

C3DPO: нейросеть генерирует 3D модель объекта по размеченному изображению

C3DPO — это нейросеть, которая восстанавливает 3D объект по разметке объекта на изображении. Нейросеть тестировалась на задачах Human3.6M, PASCAL3D+ и Synthetic Up3D против подходов, которые не требуют реальных 3D моделей…

Few-shot vid2vid: нейросеть генерирует фотореалистичные видео на основе видео с разметкой и изображения-примера

28 октября 2019

Few-shot vid2vid: нейросеть генерирует фотореалистичные видео на основе видео с разметкой и изображения-примера

Few-shot vid2vid — это нейросеть, которая генерирует реалистичную видеозапись по семантической видеозаписи и фотографии с примером. В качестве семантических видео используются видео с позами человека, c лицевыми выражениями и с…