F2ED: датасет для распознавания эмоций на лице

8 августа 2019

F2ED: датасет для распознавания эмоций на лице

F2ED — это датасет с размеченными изображениями человеческих лиц. Датасет предназначен для решения задачи end-to-end распознавания эмоций по данным с камер слежения. Данные собирались исследователями из Fudan University и Ping…

VSCO использует машинное обучение для рекомендации фильтров

28 июля 2019

VSCO использует машинное обучение для рекомендации фильтров

VSCO — одно из наиболее популярных мобильных приложений для обработки фото. Приложение помогает выбирать подходящие фильтры к фотографии с помощью сверточных нейросетей. Разработчики используют машинное обучения для рекомендации пресетов. Пресеты…

Нейросеть от Facebook размечает спутниковые снимки местности

27 июля 2019

Нейросеть от Facebook размечает спутниковые снимки местности

Исследователи в Facebook AI разработали нейросеть, которая размечает дороги на спутниковых снимках. Map With AI — это инструмент для проверки разметки, которую сделала нейросеть. Модель разметила ранее не размеченные дороги…

Нейросеть генерирует 3D-модель из наброска объекта

13 июля 2019

Нейросеть генерирует 3D-модель из наброска объекта

Нейросеть генерирует 3D-модель объекта на основе его наброска. На вход модель получает эскиз объекта в растровом формате. На выходе генерирует объект на эскизе в 3D. Модель была разработана исследователями из…

DSNet: нейросеть предсказывает количество людей на изображении

10 июля 2019

DSNet: нейросеть предсказывает количество людей на изображении

DSNet — это end-to-end нейросеть, которая определяет количество людей на снимке. Подход обходит существующие решения на 4-х задачах: ShanghaiTech, UCF-QNRF, UCF CC 50 и UCSD. Результаты экспериментов показывают, что DSNet…

DeepView: нейросеть восстанавливает 3D вид по паре фотографий

27 июня 2019

DeepView: нейросеть восстанавливает 3D вид по паре фотографий

DeepView — это нейросеть, которая по паре входных фотографий восстанавливает вид с фотографии с остальных ракурсов. Результаты работы нейросети можно посмотреть на официальном сайте. Модель получает state-of-the-art результаты на датасетах…

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

8 июня 2019

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

Mesh R-CNN — это нейросетевая архитектура, которая для объектов входного изображения предсказывает их форму. Модель была описана в работе от Facebook AI Research (FAIR). По метрикам Mesh R-CNN обходит существующие…

Как сверточные нейросети помогают дронам учиться летать

4 июня 2019

Как сверточные нейросети помогают дронам учиться летать

В Intel с помощью сверточной нейросети обучили дрона летать в динамичной среде. Система тестируется как симулированном пространстве, так и в реальном. Результаты системы превосходят state-of-the-art подход и сравнимы с профессиональным…

EDVR: нейросеть восстанавливает кадры из видеозаписи

3 июня 2019

EDVR: нейросеть восстанавливает кадры из видеозаписи

В соревновании по восстановлению видеозаписей NTIRE19 победила архитектура (EDVR), основанная на сверточных нейросетях. Модель решает проблемы восстановления резкости при приближении кадра и восстановления содержания размытых кадров в видеозаписи. Результаты EDVR…

EfficientNet: как масштабировать нейросеть с использованием AutoML

31 мая 2019

EfficientNet: как масштабировать нейросеть с использованием AutoML

В рамках ICML 2019 была опубликована работа, в которой исследователи предлагают метод для оптимизации сверточных нейросетей. Предыдущие методы произвольно масштабировали размерность нейросети (например, количество слоев и параметров). Предложенный метод равномерно…

Алгоритм DL-Net от Intel Labs восстанавливает несколько видов повреждения изображения

29 апреля 2019
DL-Net intel labs

Алгоритм DL-Net от Intel Labs восстанавливает несколько видов повреждения изображения

Свёрточные нейронные сети очень эффективны в восстановлении изображений, но большинство существующих алгоритмов способны справляться только с одним видом повреждения изображения. Исследователи из Intel Labs представили алгоритм deep likelihood network (DL-Net),…

Нейросеть Photofeeler D3 оценивает привлекательность фотографий

22 апреля 2019
оценка фотографий нейросеть

Нейросеть Photofeeler D3 оценивает привлекательность фотографий

За последнии двадцать лет онлайн-знакомства приобрели большую популярность, а первое, что оценивают пользователи приложений для знакомств — фотография профиля. Исследователи из Photofeeler Inc представили алгоритм оценки фотографий, который помогает выбрать…

Нейросеть RawNet от Xiaomi генерирует высокачественную речь

15 апреля 2019
https://docs.google.com/document/d/1e2OPAL_V9lgAT4ObON8SzX2oPebjbo2PJao6QNqrIH8/edit

Нейросеть RawNet от Xiaomi генерирует высокачественную речь

Исследователи из компании Xiaomi представили end-to-end генератор звука RawNet. Он использует сеть кодера для извлечения характеристик звука и сеть голосовых сигналов (voder) для генерации речи. Эксперименты по задачам Copy-Synthesis показывают,…

Семантическая сегментация: краткое руководство

3 апреля 2019
semantic segmentation guide

Семантическая сегментация: краткое руководство

Cемантическая сегментация изображения означает присвоение каждому пикселю определенной метки. В этом заключается главное отличие от классификации, где всему изображению ставится в соответствие только одна метка. Сегментация работает со множеством объектов…

Разработанный MIT алгоритм NAS в 200 раз быстрее аналога от Google

26 марта 2019
architectures

Разработанный MIT алгоритм NAS в 200 раз быстрее аналога от Google

Google разработала алгоритм, отвечающий за поиск оптимальной архитектуры (neural architecture search, далее NAS), которому понадобилось 48 000 часов работы GPU для создания свёрточной нейронной сети, которая используется для классификации и поиска изображений.…

Open source модель определения 3D позы по 2D изображению

18 марта 2019
оценка и предсказание 3D позы

Open source модель определения 3D позы по 2D изображению

Оценка позы человека в трехмерном пространстве находит применение во многих задачах: беспилотный транспорт, виртуальная реальность, спортивная аналитика и видеонаблюдение. Задача восстановления 3D позы человека по изображению встречается с большими трудностями,…

Нейронная сеть поможет пчеловодам уберечь пасеки от паразитов

24 февраля 2019
neural network saves bees

Нейронная сеть поможет пчеловодам уберечь пасеки от паразитов

Исследователи из Швейцарии разработали алгоритм, который поможет пчеловодам уберечь пасеки от паразитов: клещей вида Varroa destructor. Разработчики создали приложение, куда пчеловод загружает фотографии поддонов из ульев, а алгоритм проверяет фото…

RetouchNeuroBot — Telegram бот для ретуши портретных фотографий от Neurohive

13 февраля 2019

RetouchNeuroBot — Telegram бот для ретуши портретных фотографий от Neurohive

@RetouchNeuroBot — Telegram-бот для ретуши портретных фотографий и селфи. Он убирает морщины, покраснения, жирный блеск, разглаживает кожу и выравнивает цвет лица. Прямая ссылка — https://t.me/retouchneurobot. Работать с retouch_bot очень просто. Нужно…

Нейросеть DeepFlash превращает пересвеченные селфи в студийные фото

18 января 2019

Нейросеть DeepFlash превращает пересвеченные селфи в студийные фото

Ученые из Италии разработали нейронную сеть DeepFlash, которая редактирует пересвеченные селфи и превращает их в качественные фото — как будто они сделаны в студии с профессиональным освещением. Метод исправляет дефекты,…

Предобученные модели распознавания эмоций EmoPy выложили в открытый доступ

10 января 2019
EmoPy распознавание эмоций

Предобученные модели распознавания эмоций EmoPy выложили в открытый доступ

EmoPy — набор инструментов для распознавания эмоций на Python, который содержит несколько моделей с открытым исходным кодом, показывающих точность до 92% для трех эмоций и 68% для семи. Модели предлагается…

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

28 декабря 2018

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

Команда Facebook AI Research выложила в открытый доступ wav2letter ++ — модель распознавания речи, которая использует только сверточные нейронные сети (CNN). В задаче распознавания речи Wav2letter++ демонстрирует уровень ошибок 4.91-5% ,…