Speech2Gesture: нейросеть генерирует жесты на основе речи

20 июня 2019

Speech2Gesture: нейросеть генерирует жесты на основе речи

Исследователи из UC Berkley разработали нейросеть, которая на основе речи человека генерирует жесты. Модель обходит state-of-the-art решения по количественной метрике. Исследователи опубликовали датасет с видеозаписями монологов и размеченными жестами, на…

VQ-VAE-2: генерация реалистичных разноплановых изображений

5 июня 2019

VQ-VAE-2: генерация реалистичных разноплановых изображений

Исследователи из DeepMind предложили использовать модифицированный вариационный автокодировщик для генерации правдоподобных разноплановых изображений. VQ-VAE-2 конкурирует по результатам с state-of-the-art подходами. Архитектура помогает избавиться от недостатков использования GAN-ов для генерации изображений.…

Amazon Alexa распознает эмоции по голосу с помощью нейросетей

4 июня 2019

Amazon Alexa распознает эмоции по голосу с помощью нейросетей

Разработчики из Alexa Research в Amazon опубликовали описание модели, которая распознает эмоции по интонации голоса человека. В качестве модели разработчики использовали автокодировщик, который позволяет обучаться на неразмеченных данных. Обычно классификация…

GAN из изображения человека синтезирует видео с ним

22 мая 2019

GAN из изображения человека синтезирует видео с ним

В Samsung AI и Сколково опубликовали работу, в которой нейросеть генерирует видео с человеком на основе одного или двух его статичных изображений. Модель выдает реалистичные результаты и сравнима по метрикам…

FUNIT: нейросеть для image-2-image трансформаций от NVIDIA

14 мая 2019

FUNIT: нейросеть для image-2-image трансформаций от NVIDIA

В Nvidia, Cornell и Aalto разработали нейросеть (FUNIT), которая преобразует изображение объекта из одного класса в другой (например, меняет породу собаки на изображении) и при этом требует минимального количества данных…

Google AI выпустила библиотеку с результатами исследования распутывания представлений

8 мая 2019

Google AI выпустила библиотеку с результатами исследования распутывания представлений

Google AI опубликовала библиотеку disentanglement_lib, которая содержит 10800 вариационных автоэнкодеров, обученных на семи датасетах. Эта библиотека призвана помочь исследователям по всему миру решить одну из главных проблем глубокого обучения —…

Vue.ai использует нейросети для генерации маркетинговых изображений товаров

7 мая 2019
vue ai

Vue.ai использует нейросети для генерации маркетинговых изображений товаров

Стартап Vue.ai, который использует GANы для генерации маркетинговых изображений и других задач ритейла, собрал 17 миллионов долларов от институциональных инвесторов. Среди инвесторов такие фонды, как Falcon Edge Capital, Sequoia Capital…

Нейросеть FaceStyleGAN генерирует портреты из селфи в Snapchat

1 мая 2019
FaceStyleGAN

Нейросеть FaceStyleGAN генерирует портреты из селфи в Snapchat

Исследователи из Snap Inc. и Чешского Технологического Университета обучили нейросеть, которая из фотографии пользователя генерирует портрет в желаемом стиле. Пользователь выбирает изображение портрета, на который нейросеть будет опираться при переносе…

Нейросеть Fashion++ помогает в выборе образа

30 апреля 2019

Нейросеть Fashion++ помогает в выборе образа

Исследователи из Cornell Tech, UT Austin и Geogia Tech представили нейросеть, которая так модифицирует фото образа, чтобы он соответствовал актуальным трендам. Модель состоить из нейросети, которая учится синтезировать предметы одежды…

Опубликован алгоритм аппроксимации изображений за счет геометрических фигур

22 апреля 2019
image approximation

Опубликован алгоритм аппроксимации изображений за счет геометрических фигур

Исследователи из Осло опубликовали алгоритм, который создает представления изображений, используя  геометрические фигуры. Алгоритм создан с целью максимально точно аппроксимировать изображения и для разработки новых художественных стилей. Изображения аппроксимируются прозрачными, перекрывающимися…

Нейросеть RawNet от Xiaomi генерирует высокачественную речь

15 апреля 2019
https://docs.google.com/document/d/1e2OPAL_V9lgAT4ObON8SzX2oPebjbo2PJao6QNqrIH8/edit

Нейросеть RawNet от Xiaomi генерирует высокачественную речь

Исследователи из компании Xiaomi представили end-to-end генератор звука RawNet. Он использует сеть кодера для извлечения характеристик звука и сеть голосовых сигналов (voder) для генерации речи. Эксперименты по задачам Copy-Synthesis показывают,…

В Google Brain разрабатывают нейросеть для автодополнения кода

15 апреля 2019
code

В Google Brain разрабатывают нейросеть для автодополнения кода

Google Brain ведет разработку ИИ, который предсказывает изменения в коде исходя из прошлых изменений. Команда Google Brain выбрала неявную модель, которая по результатам тестов обеспечивает наилучшую общую производительность и масштабируемость из всех…

Google Brain смоделировала процесс отрисовки шрифтов

10 апреля 2019
В Google Brain смоделировали процесс отрисовки шрифтов

Google Brain смоделировала процесс отрисовки шрифтов

Ученые из Google Brain исследовали, как извлечь представления высокоуровневых характеристик объектов из векторных изображений, и использовали это для генерации шрифтов в формате SVG. Несмотря на текущие успехи в применении GANов…

Сеть HoloGAN генерирует вид сбоку и сверху на основе 2D изображения

8 апреля 2019
azimuth elevation gan

Сеть HoloGAN генерирует вид сбоку и сверху на основе 2D изображения

Группа исследователей предложила unsupervised модель GAN для восстановления 3D представлений из 2D изображений. Модель улучшила state-of-the-art результаты в генерации вида сбоку и сверху для предметов в датасетах Chairs и Cars.…

Исследователи из Стенфорда представили улучшенную модель для генерации вопросов к изображениям

8 апреля 2019

Исследователи из Стенфорда представили улучшенную модель для генерации вопросов к изображениям

Модель генерации вопросов к изображению, предложенная исследователями из Стенфордского университета, показала результаты лучше, чем существующие state-of-the-art модели IA2Q и V-IA2Q. Проблема и предыдущие исследования Ученые поставили перед собой задачу image-to-sequence…

GANSynth: создание музыки с помощью GAN

7 марта 2019
gan for music generation

GANSynth: создание музыки с помощью GAN

На конференции ICLR 2019 разработчики Google Magenta представили новый подход к синтезу аудио с помощью генеративно-состязательной нейронной сети. GANSynth позволяет генерировать музыку в 50 000 раз быстрее методов, основанных на…

Туториал: создание простой GAN на Python с библиотекой Keras

25 февраля 2019
gan python keras tutorial

Туториал: создание простой GAN на Python с библиотекой Keras

В этом туториале я расскажу о генеративно-состязательных нейронных сетях (GAN) не прибегая к математическим деталям модели. Далее будет показано, как написать собственную простую GAN на Python с Keras, которая сможет…

Сайт генерирует несуществующие предложения квартир Airbnb, используя StyleGAN

18 февраля 2019
fake airbnb-min

Сайт генерирует несуществующие предложения квартир Airbnb, используя StyleGAN

Разработчик Кристофер Шмидт создал сайт, генерирующий несуществующие предложения квартир, которые выглядят как реальные профили из онлайн-сервиса бронирования Airbnb. На первый взгляд сайт действительно может ввести в заблуждение. Картинки, текст, описание…

StyleGAN для генерации новых лиц опубликована в открытом доступе

5 февраля 2019
stylegan

StyleGAN для генерации новых лиц опубликована в открытом доступе

NVIDIA опубликовала код предобученной модели StyleGAN для генерации лиц, которые никогда не существовали. StyleGAN является state-of-the-art моделью с лучшими свойствами интерполяции и распутывания, способностью находить скрытые факторы вариации (определять положение лица…

GAN предсказывает следующий удар теннисиста и траекторию полета мяча

19 января 2019

GAN предсказывает следующий удар теннисиста и траекторию полета мяча

Исследователи из Австралии предложили метод, основанный на генеративных нейронных сетях, для предсказания местоположения мяча в теннисе во время следующего удара и прогнозирования действий игроков. Скорость движения мяча в большом теннисе…

CycleGAN: превращение текстур Fortnite в PUBG

18 января 2019
cyclegan

CycleGAN: превращение текстур Fortnite в PUBG

Перед вами перевод статьи о применении CycleGAN для переноса стиля изображений и дальнейшего применения в компьютерных играх. Автор статьи — Чинтан Триведи, ссылка на оригинал в конце текста. Если вы…