Популяционный метод увеличивает скорость аугментации в 1000 раз

9 июня 2019
популяционный метод аугментации

Популяционный метод увеличивает скорость аугментации в 1000 раз

Новый Популяционный метод аугментации (Population based augmentation, PBA) сравним по качеству с текущим state-of-the-art методом AutoAugment от Google, однако работает в тысячу раз быстрее, что позволяет широко использовать его разработчикам.…

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

8 июня 2019

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

Mesh R-CNN — это нейросетевая архитектура, которая для объектов входного изображения предсказывает их форму. Модель была описана в работе от Facebook AI Research (FAIR). По метрикам Mesh R-CNN обходит существующие…

Рекомендательная система в Alibaba научилась учитывать последовательные действия клиентов

25 мая 2019

Рекомендательная система в Alibaba научилась учитывать последовательные действия клиентов

Исследователи из Alibaba Group опубликовали описание модели Behavior Sequence Transformer (BST), которая применяется в рекомендательной системе сайта Taobao. Особенность модели заключается в том, что она анализирует последовательности действий, совершенных пользователями.…

В Samsung AI разработали новый метод для трекинга позы человека на видео

16 мая 2019

В Samsung AI разработали новый метод для трекинга позы человека на видео

Исследователи из Samsung AI и Сколково представили новую архитектуру нейросети для трекинга позы человека на видео. Метод обходит state-of-the-art подходы в случае видеосъемки с нескольких камер.  Оценка позы человека в…

Deep Network Priors: unsupervised метод подавления аудиошума

26 апреля 2019
нейросеть для шумоподавления

Deep Network Priors: unsupervised метод подавления аудиошума

Ученые из Тель-Авивского университета разработали метод Deep Network Priors для шумоподавления, идея которого схожа с методом Deep Image Prior, но в применении к звуку. Он объединяет обработку как во временной,…

Пирамидальная сеть от FAIR показала state-of-the-art результаты в сегментации изображений

25 апреля 2019
segmentation

Пирамидальная сеть от FAIR показала state-of-the-art результаты в сегментации изображений

Исследователи из Facebook AI Research представили нейросеть Panoptic FPN для сегментации объектов на изображении, которая обходит конкурирующие модели в эффективности. Panoptic FPN показала state-of-the-art результаты в задачах как семантической, так…

MorphNet от Google: open source нейросеть для оптимизации нейросетей

23 апреля 2019
morphnet

MorphNet от Google: open source нейросеть для оптимизации нейросетей

Google AI представила модель MorphNet, которая берет на вход любую нейронную сеть и оптимизирует ее так, чтобы она имела большую скорость, меньший размер и лучшую производительность без потери качества модели…

Сеть HoloGAN генерирует вид сбоку и сверху на основе 2D изображения

8 апреля 2019
azimuth elevation gan

Сеть HoloGAN генерирует вид сбоку и сверху на основе 2D изображения

Группа исследователей предложила unsupervised модель GAN для восстановления 3D представлений из 2D изображений. Модель улучшила state-of-the-art результаты в генерации вида сбоку и сверху для предметов в датасетах Chairs и Cars.…

OpenAI представила масштабированную версию energy-based моделей

29 марта 2019
energy-based model

OpenAI представила масштабированную версию energy-based моделей

Преимущества energy-based моделей — генерализирующая способность и простота архитектуры. Но на практике их обучение вызывает сложности. Исследователи из OpenAI предложили способы оптимизации обучения EBM модели на основе MCMC (Marcov Chain…

Open source модель определения 3D позы по 2D изображению

18 марта 2019
оценка и предсказание 3D позы

Open source модель определения 3D позы по 2D изображению

Оценка позы человека в трехмерном пространстве находит применение во многих задачах: беспилотный транспорт, виртуальная реальность, спортивная аналитика и видеонаблюдение. Задача восстановления 3D позы человека по изображению встречается с большими трудностями,…

Беспилотные автомобили — насколько мы далеки от полной автономности?

6 февраля 2019
self-driving-cars

Беспилотные автомобили — насколько мы далеки от полной автономности?

Беспилотные автомобили в ближайшие несколько лет перестанут быть научной фантастикой. В последние несколько месяцев мы стали свидетелями стремительного развития этой технологии. Waymo (ранее проект Google, сейчас является частью Alphabet) два месяца назад запустил…

StyleGAN для генерации новых лиц опубликована в открытом доступе

5 февраля 2019
stylegan

StyleGAN для генерации новых лиц опубликована в открытом доступе

NVIDIA опубликовала код предобученной модели StyleGAN для генерации лиц, которые никогда не существовали. StyleGAN является state-of-the-art моделью с лучшими свойствами интерполяции и распутывания, способностью находить скрытые факторы вариации (определять положение лица…

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

28 декабря 2018

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

Команда Facebook AI Research выложила в открытый доступ wav2letter ++ — модель распознавания речи, которая использует только сверточные нейронные сети (CNN). В задаче распознавания речи Wav2letter++ демонстрирует уровень ошибок 4.91-5% ,…

Нейросеть StyleGAN генерирует идеальные новые лица с помощью алгоритмов переноса стиля

14 декабря 2018
stylegan

Нейросеть StyleGAN генерирует идеальные новые лица с помощью алгоритмов переноса стиля

Исследователи Nvidia опубликовали альтернативную архитектуру GAN, основанную на алгоритмах переноса стиля (style transfer). StyleGAN отделяет атрибуты высокого (например, позы и лица) и низкого уровня (веснушки и волосы) и генерирует новое…

Как HMTL помогает улучшить итоговую точность в задачах NLP

5 декабря 2018
многозадачное обучение hmtl

Как HMTL помогает улучшить итоговую точность в задачах NLP

Да, вы правильно прочитали, это правда HMTL — модель Hierarchical Multi-Task Learning, что дословно переводится как Иерархическое многозадачное обучение. Наблюдается нарастающая волна как в NLP, так и в целом в глубоком…

Новый метод переноса движений из видео на виртуального персонажа

9 ноября 2018

Новый метод переноса движений из видео на виртуального персонажа

Создание реалистичных, похожих на настоящих людей персонажей — важная задача компьютерной анимации. Анимация персонажей применяется в  создании мультфильмов, компьютерных игр, спецэффектов в кино и виртуальной реальности. Ранние работы Анимация персонажей…

Восстановление 3D-модели волос и головы из видео

6 ноября 2018

Восстановление 3D-модели волос и головы из видео

Трехмерные модели волос используются в виртуальной и дополненной реальности, видеоиграх, медицинском ПО. Однако создать реалистичную 3D-модель прически трудно даже в контролируемой среде. Исследователи предложили метод решения ещё более сложной задачи…

The Sound Of Pixels: новый метод локализации и разделения звуков на видео

31 октября 2018

The Sound Of Pixels: новый метод локализации и разделения звуков на видео

Исследователи давно изучают взаимосвязь видео и звука и проблемы, связанные с их обработкой. В прошлом учёные рассматривали проблемы локализации звука в видео, создание аудио для видео без звука, обучение без учителя…

BrainNet — интерфейс «мозг-мозг» для прямого взаимодействия людей

26 октября 2018

BrainNet — интерфейс «мозг-мозг» для прямого взаимодействия людей

Большинство исследований, связанных с коммуникационными интерфейсами мозга, сосредоточены на интерфейсах «мозг-компьютер». Меньше результатов получено в области соединения двух или нескольких мозгов. Недавно ученые представили новый метод, который позволяет трем людям сотрудничать…

Selfie ID: подтверждение личности с помощью глубокого обучения

22 октября 2018
Selfie Matching DocFace+ DWI

Selfie ID: подтверждение личности с помощью глубокого обучения

Подтверждение личности — механизм обеспечения безопасности, широко применяющийся в контроле доступа при пересечении международных границ и управлении банковскими транзакциями. Кроме того, подтверждение личности требуется практически каждый день: при входе в офис, при…

Deep Claster — алгоритм глубокой кластеризации. Он почти достиг человеческой точности

19 октября 2018
deep claster - кластеризация изображений

Deep Claster — алгоритм глубокой кластеризации. Он почти достиг человеческой точности

Кластеризация изображений считается хорошо изученной областью машинного обучения. Однако, на самом деле, до сих пор не было сделано значимых попыток адаптировать этот подход к изучению визуальных особенностей на датасетах высокого…