Проект generated.photos опубликовали датасет с 100 тысячами лиц в высоком разрешении. Изображения лиц были сгенерированы с помощью StyleGAN. StyleGAN — это state-of-the-art генеративная нейросеть. Опубликованные изображения можно свободно использовать в коммерческих целях с указанием ссылки на разработчиков. Подобная услуга может интересовать редакторов журналов, специалистов по рекламе, веб-дизайнеров и т.п. Использование синтетических изображений сокращает траты медиа-специалистов на кастинги и фотосъемки.
Подробнее про данные
Для обучения StyleGAN использовались архивы портретных снимков фотостудии. Согласно разработчикам, всего собрали 29 тысяч фотографий 69 моделей. Данные собирались последние два года. Заявляется, что все модели дали личное согласие на обработку персональных данных.
Все фотографии для обучающей выборки исследователи сделали в контролируемых условиях. Свет и последующая обработка изображений были идентичны для всех изображений. Это требовалось, чтобы обеспечить стабильность качества генерируемых изображений. После того как фотографии были собраны, команда проекта вручную размечала и категоризовала лица на изображениях.
Однако изображения из сгенерированного датасета содержат артефакты. Однако изображения из сгенерированного датасета не лишены артефактов. Вместо того чтобы избавиться от артефактов на сгенерированных изображениях, разработчики в процессе обучения классификатора, который определяет, достаточно ли высоко качество изображения, чтобы добавить его в итоговый датасет.
Разработчики отмечают, что в дальнейшем планируют разнообразить типы внешности в обучающей выборке.