Adversarial Latent Autoencoder (ALAE) — это нейросетевая модель для генерации изображений. В основе ALAE лежит архитектура автоэнкодера. ALAE учитывает последние улучшения по обучению GAN. Исследователи разработали два автоэнкодера: один с генератором основанном на многослойном перцептроне и StyleALAE, в котором в качестве генератора используется генератор из StyleGAN. По результатам экспериментов, StyleALAE генерирует сравнимые по реалистичности изображения с StyleGAN. При этом StyleALAE способна реконструировать и модифицировать лица на изображении.
Автоэнкодер — это метод обучения без учителя, целью которого возможность генерировать и представлять изображение. Это осуществляется за счет того, что модель выучивает карту энкодера-генератора (encoder-generator map). Несмотря на то, что автоэнкодеры активно исследовались, до сих пор остается открытым вопрос, сравнимы ли они по генеративной способности с GAN.
Как устроен ALAE
Исследователи предлагают две архитектуры автоэнкодера:
- Автоэнкодер, в котором в качестве генератора используется многослойный перцептрон;
- StyleALAE, в котором в качестве генератора используется генератор из StyleGAN
Энкодер в StyleALAE имеет слои с instance нормализацией (IN), чтобы извлекать информацию о стиле изображения. Эта информация комбинируется со скрытым представлением с помощью обучаемого параметра multilinear map.