BigBiGAN: новый state-of-the-art подход в обучении представлений

15 июля 2019

BigBiGAN: новый state-of-the-art подход в обучении представлений

BigBiGAN — это генеративная нейросеть, которую адаптировали к задаче обучения представлений. В основе BigBiGAN лежит BigGAN,  — текущий state-of-the-art для генерации изображений. Модель была разработана исследователями из DeepMind. Состязательные генеративные…

Как различается качество облачных ML-сервисов у Amazon, Google и Microsoft

14 июля 2019

Как различается качество облачных ML-сервисов у Amazon, Google и Microsoft

Исследователи протестировали работу облачных сервисов для компьютерного зрения от Amazon, Google и Microsoft. Эксперименты проходили 11 месяцев на 3-х разных задачах. Результаты показывали нестабильность результатов сервисов между собой и во…

Google открыли соревнование по сегментации изображений

14 июля 2019
google brain bert ai

Google открыли соревнование по сегментации изображений

Google запустили второе соревнование по компьютерному зрению на Kaggle — Open Images 2019. Соревнование делится на три трека: распознавание объектов, выявление взаимосвязей между объектами и instance сегментация объектов. Участие можно…

DSNet: нейросеть предсказывает количество людей на изображении

10 июля 2019

DSNet: нейросеть предсказывает количество людей на изображении

DSNet — это end-to-end нейросеть, которая определяет количество людей на снимке. Подход обходит существующие решения на 4-х задачах: ShanghaiTech, UCF-QNRF, UCF CC 50 и UCSD. Результаты экспериментов показывают, что DSNet…

Нейросеть генерирует видеолекции на основе аудиозаписей

8 июля 2019

Нейросеть генерирует видеолекции на основе аудиозаписей

Исследователи из Udacity разработали нейросеть LumièreNet, которая на основе аудиоклипов синтезирует видеолекции в высоком разрешении. Примеры сгенерированных видеозаписей находятся по ссылкам: первый пример, второй пример. В отличие от предшествующих моделей,…

Обзор методов супер-разрешения изображений для начинающих

5 июля 2019

Обзор методов супер-разрешения изображений для начинающих

Супер-разрешение — это результат восстановления изображения с высоким разрешением (HR) из данного изображения с низким разрешением (LR). В этой статье приведены основные подходы для решения задачи генерации супер-разрешения изображения с…

Human in the Loop: как сократить ресурсы на разметку данных

29 июня 2019

Human in the Loop: как сократить ресурсы на разметку данных

BatchBALD — метод для выбора информативных данных для разметки. Подход основан на теории информации. В открытом доступе лежит реализация алгоритма. Что такое активное обучение Использование глубокого обучения и больших размеченных…

Как делать аугментацию данных для задачи распознавания объектов

29 июня 2019

Как делать аугментацию данных для задачи распознавания объектов

Исследователи из Google Brain разработали метод поиска оптимальной обработки изображений перед обучением модели. Расширение данных с помощью методов аугментации увеличивает точность модели — на 2.3 пункта для COCO и на…

YouTube-8M Segments: датасет с видеозаписями из YouTube

29 июня 2019

YouTube-8M Segments: датасет с видеозаписями из YouTube

YouTube-8M — это датасет с видеозаписями из YouTube, который собрали в Google. В обновленной версии датасета для части видеозаписей разметили содержание видео в динамике. Компания запустила соревнование по анализу видеоданных…

DeepView: нейросеть восстанавливает 3D вид по паре фотографий

27 июня 2019

DeepView: нейросеть восстанавливает 3D вид по паре фотографий

DeepView — это нейросеть, которая по паре входных фотографий восстанавливает вид с фотографии с остальных ракурсов. Результаты работы нейросети можно посмотреть на официальном сайте. Модель получает state-of-the-art результаты на датасетах…

Waymo публикует данные для обучения автопилотных автомобилей

24 июня 2019

Waymo публикует данные для обучения автопилотных автомобилей

Waymo публикуют датасет для обучения моделей автопилотных автомобилей. Датасет будет включать в  себя видеозаписи вождения с размеченными объектами. Компания Waymo разрабатывает автопилотные автомобили с 2009 года и входит в группу…

STEAL: нейросеть детектирует границы объектов на шумных данных

22 июня 2019

STEAL: нейросеть детектирует границы объектов на шумных данных

NVIDIA обучили нейросеть (STEAL), которая делает размеченные границы объектов более точными. STEAL работает поверх любой архитектуры по семантической сегментации объектов. В экспериментах нейросеть обходит state-of-the-art методы на 4% по MF…

Reasoning-RCNN: нейросеть распознает объекты из тысяч категорий

13 июня 2019

Reasoning-RCNN: нейросеть распознает объекты из тысяч категорий

Reasoning-RCNN детектирует трудно различимые объекты на изображении и работает поверх любого детектора. Reasoning-RCNN улучшает state-of-the-art результаты для нескольких соревнований: на 16% для VisualGenome, на 37% для ADE и на 15%…

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

11 июня 2019

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

3D-BoNet — это нейросетевая модель, которая распознает объекты на 3D изображениях и решает задачу instance сегментации в 10 раз более вычислительно эффективно по сравнению с существующими подходами. Под 3D изображением…

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

8 июня 2019

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

Mesh R-CNN — это нейросетевая архитектура, которая для объектов входного изображения предсказывает их форму. Модель была описана в работе от Facebook AI Research (FAIR). По метрикам Mesh R-CNN обходит существующие…

VQ-VAE-2: генерация реалистичных разноплановых изображений

5 июня 2019

VQ-VAE-2: генерация реалистичных разноплановых изображений

Исследователи из DeepMind предложили использовать модифицированный вариационный автокодировщик для генерации правдоподобных разноплановых изображений. VQ-VAE-2 конкурирует по результатам с state-of-the-art подходами. Архитектура помогает избавиться от недостатков использования GAN-ов для генерации изображений.…

Как сверточные нейросети помогают дронам учиться летать

4 июня 2019

Как сверточные нейросети помогают дронам учиться летать

В Intel с помощью сверточной нейросети обучили дрона летать в динамичной среде. Система тестируется как симулированном пространстве, так и в реальном. Результаты системы превосходят state-of-the-art подход и сравнимы с профессиональным…

EDVR: нейросеть восстанавливает кадры из видеозаписи

3 июня 2019

EDVR: нейросеть восстанавливает кадры из видеозаписи

В соревновании по восстановлению видеозаписей NTIRE19 победила архитектура (EDVR), основанная на сверточных нейросетях. Модель решает проблемы восстановления резкости при приближении кадра и восстановления содержания размытых кадров в видеозаписи. Результаты EDVR…

EfficientNet: как масштабировать нейросеть с использованием AutoML

31 мая 2019

EfficientNet: как масштабировать нейросеть с использованием AutoML

В рамках ICML 2019 была опубликована работа, в которой исследователи предлагают метод для оптимизации сверточных нейросетей. Предыдущие методы произвольно масштабировали размерность нейросети (например, количество слоев и параметров). Предложенный метод равномерно…

SANet: модель, которая переносит стиль с картины на изображение

30 мая 2019

SANet: модель, которая переносит стиль с картины на изображение

Artificial Intelligence Research Institute в Корее опубликовали SANet — нейросетевую модель, которая накладывает на изображение стиль с картины. В нейросети можно регулировать параметр, который отвечает за то, насколько сильно модифицируется…

Нейросеть Speech2Face генерирует изображение лица человека по аудиозаписи голоса

28 мая 2019

Нейросеть Speech2Face генерирует изображение лица человека по аудиозаписи голоса

В Лаборатории искусственного интеллекта MIT опубликовали Speech2Face — модель, которая реконструирует лицо человека по записи его голоса. Нейросеть обучалась на миллионах видеозаписей с YouTube, на которых демонстрируется разговор человека. Задача…