DeepFovea: нейросеть восстанавливает AR/VR объекты

19 ноября 2019

DeepFovea: нейросеть восстанавливает AR/VR объекты

DeepFovea — это система для фовеального рендеринга для AR/VR дисплеев, которая основана на нейросетях. Фовеальный рендеринг отвечает за визуализацию только той части экрана, на которую в текущий момент направлен взгляд…

Graph2Diff: нейросеть исправляет ошибки в коде

15 ноября 2019

Graph2Diff: нейросеть исправляет ошибки в коде

Graph2Diff — это графовая нейросеть, которая предлагает исправления для ошибок при сборке программы. Разработкой модели занимались исследователи из Google. Профессиональные программисты тратят значительную часть времени на исправление ошибок при сборке…

Нейросеть выучивает базовые физические законы

14 ноября 2019

Нейросеть выучивает базовые физические законы

Исследователи из Uber AI предложили архитектуру нейросети, которая выучивает физические законы. Модель протестировали на задаче предсказания наблюдений системы массы-пружины. В сравнении с стандартной архитектурой нейросети Гамильтовы нейросети обладают большей обобщающей…

NVIDIA Turing GPU и Xavier установили рекорд по скорости на MLPerf

14 ноября 2019

NVIDIA Turing GPU и Xavier установили рекорд по скорости на MLPerf

MLPerf — это открытая платформа для тестирования оборудования для обучения ML-моделей. Продукты от NVIDIA, — Turing GPU и система Xavier, — заняли первые места на MLPerf Inference 0.5 по скорости…

MLQA: датасет для мультиязычной вопросно-ответной системы

14 ноября 2019

MLQA: датасет для мультиязычной вопросно-ответной системы

MLQA — это датасет для оценки моделей на задаче генерации экстрактивных ответов на вопросы (QA). Датасет был собран для того, чтобы способствовать улучшению и расширению задачи генерации ответов на большее…

Нейросеть восстанавливает изображения по данным ЭЭГ

14 ноября 2019

Нейросеть восстанавливает изображения по данным ЭЭГ

В МФТИ и Neurobotics обучили нейросеть, которая восстанавливает изображение по данным ЭЭГ. Одним из применений нейросети является использование в девайсах для реабилитации после инсульта.  Чтобы разрабатывать устройства, которые контролируются мозгом,…

DialoGPT: в Microsoft GPT-2 обучили генерировать ответы в диалоге

12 ноября 2019

DialoGPT: в Microsoft GPT-2 обучили генерировать ответы в диалоге

DialoGPT — это диалоговая модель, которую обучили на 147 миллионах комментариев в Reddit. Нейросеть генерирует ответы на реплики пользователя (single-turn dialogue). DialoGPT базируется на GPT-2. Обучающая выборка состояла из цепочек…

Objects365: датасет для распознавания объектов

9 ноября 2019

Objects365: датасет для распознавания объектов

Objects365 — это самый крупный размеченный датасет для распознавания объектов. Данные состоят из 638 тысяч изображений, 365 категорий объектов и 10 миллионов размеченных границ объектов. Датасет и предобученные нейросети доступны…

Нейросеть разделяет аудиозапись на вокал и инструментальную часть

9 ноября 2019

Нейросеть разделяет аудиозапись на вокал и инструментальную часть

Deezer опубликовали библиотеку на Python Spleeter. Spleeter состоит из предобученных нейросетевых моделей, которые разделяют музыкальную запись на 2, 4 или 5 дорожек. Модели в библиотеке реализованы на TensorFlow. Deezer —…

Какие объекты GAN генерировать не может

9 ноября 2019

Какие объекты GAN генерировать не может

Исследователи из MIT CSAIL изучили, какие объекты генеративным нейросетям сложнее синтезировать. На примере датасета LSUN churches такие классы объектов, как люди, машины и ворота, игнорируются генератором нейросети. Несмотря на успех…

JRDB: датасет для обучения нейросетей визуальному восприятию

8 ноября 2019

JRDB: датасет для обучения нейросетей визуальному восприятию

JRDB — это набор данных с 64 минутами мультимодальных сенсорных данных. Датасет был собран с помощью робота JackRabbot. Данные содержат видео 360 градусов, 3D облака точек, аудиосигналы, сферическую панораму и…

VTAB: задачи для проверки качества представлений изображений

7 ноября 2019

VTAB: задачи для проверки качества представлений изображений

Google AI опубликовали тестовые задачи для оценки моделей, которые генерируют представления изображений. VTAB (The Visual Task Adaptation Benchmark) состоит из 19 датасетов. Результаты моделей фиксируются на публичном лидерборде. Описание проблемы…

Какие ошибки чаще всего совершают при обучении нейросетей

6 ноября 2019

Какие ошибки чаще всего совершают при обучении нейросетей

Исследователи из USI выделили основные проблемы, с которыми сталкиваются разработчики при обучении нейросетей. Выборка состояла из 1059 проблем и коммитов ML-репозиториев на GitHub, которые были вручную проанализированы. Чтобы валидировать выделенный…

DFDC: соревнование по распознаванию deepfake

1 ноября 2019

DFDC: соревнование по распознаванию deepfake

Deepfake Detection Challenge (DFDC) — это соревнование по распознаванию deepfake на видеозаписях. Дата начала соревнования назначена на декабрь. Частично датасет доступен публично. Публикация полного датасета пройдет на конференции Neural Information…

Как обучить трансформер на одном языке и перенести его на другой

1 ноября 2019

Как обучить трансформер на одном языке и перенести его на другой

Исследователи из DeepMind проверили, как предобученный на данных одного языка трансформер переносится на другой язык. Исследователи публикуют новый датасет с кросс-языковыми парами вопросов и ответов (XQuAD). Датасет состоит из 240…

CBNet: нейросетевая архитектура для распознавания объектов

1 ноября 2019

CBNet: нейросетевая архитектура для распознавания объектов

В существующих детекторах, которые основываются на сверточных нейросетях, основная сеть архитектуры играет важную роль. Выбор основной сети архитектуры (backbone network) влияет на качество модели. Исследователи предлагают улучшить качество модели с…

NLP модели на TensorFlow 2.0 в 10 строк кода

1 ноября 2019

NLP модели на TensorFlow 2.0 в 10 строк кода

Transformers — это библиотека на Python для обучения state-of-the-art моделей в обработке естественного языка. Разработкой библиотеки занимается компания HuggingFace. Transformers предоставляет API для использования таких архитектур трансформеров, как BERT, RoBERTa,…

SGD: датасет с диалогами для обучения персональных ассистентов

1 ноября 2019

SGD: датасет с диалогами для обучения персональных ассистентов

В Google AI опубликовали датасет с диалогами для обучения персональных ассистентов. Schema-Guided Dataset (SGD) состоит из 18 тысяч размеченных разговоров между пользователем и персональным ассистентом. В датасете обеспечивается разнообразие тем…

Gradient: инструмент для обучения ML моделей на GPU

1 ноября 2019

Gradient: инструмент для обучения ML моделей на GPU

Компания Paperspace опубликовала инструмент для обучения ML алгоритмов на бесплатных GPU. Gradient Community Notebooks — это бесплатный облачный GPU сервис, который основан на Jupyter ноутбуках.  Настройка и поддержка окружения для…

SlowFast: архитектура для распознавания действий на видео

1 ноября 2019

SlowFast: архитектура для распознавания действий на видео

SlowFast — это нейросетевая архитектура, которая адаптирована для классификации действий на видео. Модель одновременно обрабатывает видео на высокой и низкой кадровой частоте. Нейросеть использует два канала обработки данных: первый фокусируется…

Мультиагентная RL-система получила титул Грандмастера в StarCraft II

1 ноября 2019

Мультиагентная RL-система получила титул Грандмастера в StarCraft II

Модель AlphaStar от DeepMind обучилась играть в StarCraft II на уровне Грандмастера. В общем рейтинге модель обошла 99.8% активных игроков. Уровень Грандмастера был достигнут для всех трех типов игроков: Protoss,…