Генеративная нейросеть меняет задний фон на изображении

Исследователи из University of Washington опубликовали модель, которая подменяет задний фон на изображении. Алгоритм обходит state-of-the-art подходы. Примерами применений модели является съемка видео или смена заднего фона во время видео-звонков.

Задача матирования изображения

Матирование (matting) — это процесс отделения переднего плана изображения от заднего плана, чтобы сменить задний фон изображения. Обычно для такой цели используется хромакей, — зеленое полотно ткани, на фоне которого снимают видеозапись. Чтобы иметь возможность менять задний фон на любой видеозаписи, исследователи предлагают использовать генеративно-состязательную нейросеть.

Архитектура подхода

Нейросеть состоит из supervised блока, за которым идет unsupervised блок для уточнения (refinement) предсказания нейросети. 

Модель обучалась на датасете Adobe Composition-1k, который состоит из 450 аннотированных изображений. Для каждого изображения доступна разметка его переднего фона. Во время обучения модель принимает на вход изображение, фон, сегментацию и информацию о движении. Context Switching блок, который вводят исследователи, отвечает за устойчивость предсказаний. 

На шаге уточнения предсказания нейросети используется GAN. GAN принимает на вход предсказанный передний фон входного изображений и переносит его на новый задний фон. Генератор выучивается обновлять границы переднего фона.

Визуализация составных частей нейросети
Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt