GACN — это нейросетевая модель, которая фокусирует объекты на изображении. Модель принимает на вход набор изображений одной сцены. На их основе нейросеть генерирует итоговое изображение, на котором все объекты находятся в фокусе.
В чем проблема
На изображениях часто основные объекты переднего плана находятся в фокусе, в то время как объекты на заднем фоне заблюррены. Это происходит из-за ограничений оптических линз. Есть задача генерации изображения, на котором все объекты будут в фокусе. Исследователи из University of Science and Technology Beijing и Norwegian University of Science and Technology предлагают нейросеть, которая объединяет набор изображений одной сцены и генерирует итоговое изображение, на котором все объекты в фокусе.
Подробнее про архитектуру подхода
Структура сети, которая объединяет входные изображения, состоит из двух частей:
- Извлечение признаков: на этом этапе для каждого входного изображения извлекаются признаки;
- Принятие решения: модуль решения выдает карту решений, в которой для каждого пикселя входного изображения есть вероятность, с которой этот пиксель более четкий, чем схожие с ним
Тестирование работы модели
Исследователи сравнили предложенную GACN с SOTA алгоритмами. Ниже видно, что модель выдает сравнимые с state-of-the-art архитектурами результаты.