Нейросеть генерирует аниме-персонажа из изображения

11 августа 2019

Нейросеть генерирует аниме-персонажа из изображения

U-GAT-IT — это генеративная нейросеть для синтезации изображений, которая обучается без учителя. Разработчики протестировали ее работу на задаче генерации изображений аниме-персонажей из обычных фотографий людей. Результаты экспериментов показывают, что U-GAT-IT…

F2ED: датасет для распознавания эмоций на лице

8 августа 2019

F2ED: датасет для распознавания эмоций на лице

F2ED — это датасет с размеченными изображениями человеческих лиц. Датасет предназначен для решения задачи end-to-end распознавания эмоций по данным с камер слежения. Данные собирались исследователями из Fudan University и Ping…

Нейросеть реконструировала строение мозга мухи в 3D

7 августа 2019

Нейросеть реконструировала строение мозга мухи в 3D

Исследователи из Google AI разработали нейросеть, которая воссоздала структуру мозга мухи в 3D. В качестве архитектуры были использованы Flood-Filling нейросети. Neuroglancer — это 3D-интерфейс для изучения структуры мозга мухи, который…

BigBiGAN: новый state-of-the-art подход в обучении представлений

15 июля 2019

BigBiGAN: новый state-of-the-art подход в обучении представлений

BigBiGAN — это генеративная нейросеть, которую адаптировали к задаче обучения представлений. В основе BigBiGAN лежит BigGAN,  — текущий state-of-the-art для генерации изображений. Модель была разработана исследователями из DeepMind. Состязательные генеративные…

Нейросеть генерирует видеолекции на основе аудиозаписей

8 июля 2019

Нейросеть генерирует видеолекции на основе аудиозаписей

Исследователи из Udacity разработали нейросеть LumièreNet, которая на основе аудиоклипов синтезирует видеолекции в высоком разрешении. Примеры сгенерированных видеозаписей находятся по ссылкам: первый пример, второй пример. В отличие от предшествующих моделей,…

Speech2Gesture: нейросеть генерирует жесты на основе речи

20 июня 2019

Speech2Gesture: нейросеть генерирует жесты на основе речи

Исследователи из UC Berkley разработали нейросеть, которая на основе речи человека генерирует жесты. Модель обходит state-of-the-art решения по количественной метрике. Исследователи опубликовали датасет с видеозаписями монологов и размеченными жестами, на…

VQ-VAE-2: генерация реалистичных разноплановых изображений

5 июня 2019

VQ-VAE-2: генерация реалистичных разноплановых изображений

Исследователи из DeepMind предложили использовать модифицированный вариационный автокодировщик для генерации правдоподобных разноплановых изображений. VQ-VAE-2 конкурирует по результатам с state-of-the-art подходами. Архитектура помогает избавиться от недостатков использования GAN-ов для генерации изображений.…

Amazon Alexa распознает эмоции по голосу с помощью нейросетей

4 июня 2019

Amazon Alexa распознает эмоции по голосу с помощью нейросетей

Разработчики из Alexa Research в Amazon опубликовали описание модели, которая распознает эмоции по интонации голоса человека. В качестве модели разработчики использовали автокодировщик, который позволяет обучаться на неразмеченных данных. Обычно классификация…

GAN из изображения человека синтезирует видео с ним

22 мая 2019

GAN из изображения человека синтезирует видео с ним

В Samsung AI и Сколково опубликовали работу, в которой нейросеть генерирует видео с человеком на основе одного или двух его статичных изображений. Модель выдает реалистичные результаты и сравнима по метрикам…

FUNIT: нейросеть для image-2-image трансформаций от NVIDIA

14 мая 2019

FUNIT: нейросеть для image-2-image трансформаций от NVIDIA

В Nvidia, Cornell и Aalto разработали нейросеть (FUNIT), которая преобразует изображение объекта из одного класса в другой (например, меняет породу собаки на изображении) и при этом требует минимального количества данных…

Google AI выпустила библиотеку с результатами исследования распутывания представлений

8 мая 2019

Google AI выпустила библиотеку с результатами исследования распутывания представлений

Google AI опубликовала библиотеку disentanglement_lib, которая содержит 10800 вариационных автоэнкодеров, обученных на семи датасетах. Эта библиотека призвана помочь исследователям по всему миру решить одну из главных проблем глубокого обучения —…

Vue.ai использует нейросети для генерации маркетинговых изображений товаров

7 мая 2019
vue ai

Vue.ai использует нейросети для генерации маркетинговых изображений товаров

Стартап Vue.ai, который использует GANы для генерации маркетинговых изображений и других задач ритейла, собрал 17 миллионов долларов от институциональных инвесторов. Среди инвесторов такие фонды, как Falcon Edge Capital, Sequoia Capital…

Нейросеть FaceStyleGAN генерирует портреты из селфи в Snapchat

1 мая 2019
FaceStyleGAN

Нейросеть FaceStyleGAN генерирует портреты из селфи в Snapchat

Исследователи из Snap Inc. и Чешского Технологического Университета обучили нейросеть, которая из фотографии пользователя генерирует портрет в желаемом стиле. Пользователь выбирает изображение портрета, на который нейросеть будет опираться при переносе…

Нейросеть Fashion++ помогает в выборе образа

30 апреля 2019

Нейросеть Fashion++ помогает в выборе образа

Исследователи из Cornell Tech, UT Austin и Geogia Tech представили нейросеть, которая так модифицирует фото образа, чтобы он соответствовал актуальным трендам. Модель состоить из нейросети, которая учится синтезировать предметы одежды…

Опубликован алгоритм аппроксимации изображений за счет геометрических фигур

22 апреля 2019
image approximation

Опубликован алгоритм аппроксимации изображений за счет геометрических фигур

Исследователи из Осло опубликовали алгоритм, который создает представления изображений, используя  геометрические фигуры. Алгоритм создан с целью максимально точно аппроксимировать изображения и для разработки новых художественных стилей. Изображения аппроксимируются прозрачными, перекрывающимися…

Нейросеть RawNet от Xiaomi генерирует высокачественную речь

15 апреля 2019
https://docs.google.com/document/d/1e2OPAL_V9lgAT4ObON8SzX2oPebjbo2PJao6QNqrIH8/edit

Нейросеть RawNet от Xiaomi генерирует высокачественную речь

Исследователи из компании Xiaomi представили end-to-end генератор звука RawNet. Он использует сеть кодера для извлечения характеристик звука и сеть голосовых сигналов (voder) для генерации речи. Эксперименты по задачам Copy-Synthesis показывают,…

В Google Brain разрабатывают нейросеть для автодополнения кода

15 апреля 2019
code

В Google Brain разрабатывают нейросеть для автодополнения кода

Google Brain ведет разработку ИИ, который предсказывает изменения в коде исходя из прошлых изменений. Команда Google Brain выбрала неявную модель, которая по результатам тестов обеспечивает наилучшую общую производительность и масштабируемость из всех…

Google Brain смоделировала процесс отрисовки шрифтов

10 апреля 2019
В Google Brain смоделировали процесс отрисовки шрифтов

Google Brain смоделировала процесс отрисовки шрифтов

Ученые из Google Brain исследовали, как извлечь представления высокоуровневых характеристик объектов из векторных изображений, и использовали это для генерации шрифтов в формате SVG. Несмотря на текущие успехи в применении GANов…

Сеть HoloGAN генерирует вид сбоку и сверху на основе 2D изображения

8 апреля 2019
azimuth elevation gan

Сеть HoloGAN генерирует вид сбоку и сверху на основе 2D изображения

Группа исследователей предложила unsupervised модель GAN для восстановления 3D представлений из 2D изображений. Модель улучшила state-of-the-art результаты в генерации вида сбоку и сверху для предметов в датасетах Chairs и Cars.…

Исследователи из Стенфорда представили улучшенную модель для генерации вопросов к изображениям

8 апреля 2019

Исследователи из Стенфорда представили улучшенную модель для генерации вопросов к изображениям

Модель генерации вопросов к изображению, предложенная исследователями из Стенфордского университета, показала результаты лучше, чем существующие state-of-the-art модели IA2Q и V-IA2Q. Проблема и предыдущие исследования Ученые поставили перед собой задачу image-to-sequence…

GANSynth: создание музыки с помощью GAN

7 марта 2019
gan for music generation

GANSynth: создание музыки с помощью GAN

На конференции ICLR 2019 разработчики Google Magenta представили новый подход к синтезу аудио с помощью генеративно-состязательной нейронной сети. GANSynth позволяет генерировать музыку в 50 000 раз быстрее методов, основанных на…