fbpx
  • MichiGAN: нейросеть редактирует прическу на изображении

    MichiGAN — это генеративно-состязательная нейросеть, которая редактирует прическу на изображении. На основе портретного снимка модель позволяет модифицировать прическу персоны по нескольким референсным снимкам. Модель дает возможность редактировать отдельное такие атрибуты прически, как внешний вид, структура и форма. При этом задний фон изображения остается целым. Кроме того, модель может модифицировать несколько атрибутов прически совместно. По результатам экспериментов, MichiGAN обходит альтернативные подходы по степени интерактивности редактирования и по качеству итоговых снимков.

    Интерактивная система редактирования прически

    Подробнее про модель

    MichiGAN состоит из базовой генеративной сети и трех условных модулей (condition modules): для формы и структуры, внешнего вида и заднего фона. Генератор — это последовательная конкатенация шести апсемплинг остаточных блоков SPADE (ResBlk) и сверточный слой, который выдает итоговое изображение. 

    Визуализация составных частей подхода

    Подробнее условные модули и базовая архитектура описаны в оригинальной статье.

    Оценка работы модели

    Исследователи сравнивали работу MichiGAN с альтернативными архитектурами. Ниже видно, что модель работает сравнимо или лучше state-of-the-art моделей, в зависимости от разрешения изображений.

    Количественное сравнение конкурирующих подходов на датасете Flickr-Faces-HQ