fbpx
  • GACN: нейросеть избавляется от размытия на изображении

    GACN — это нейросетевая модель, которая фокусирует объекты на изображении. Модель принимает на вход набор изображений одной сцены. На их основе нейросеть генерирует итоговое изображение, на котором все объекты находятся в фокусе.

    В чем проблема

    На изображениях часто основные объекты переднего плана находятся в фокусе, в то время как объекты на заднем фоне заблюррены. Это происходит из-за ограничений оптических линз. Есть задача генерации изображения, на котором все объекты будут в фокусе. Исследователи из University of Science and Technology Beijing и Norwegian University of Science and Technology предлагают нейросеть, которая объединяет набор изображений одной сцены и генерирует итоговое изображение, на котором все объекты в фокусе.

    Подробнее про архитектуру подхода

    Структура сети, которая объединяет входные изображения, состоит из двух частей:

    1. Извлечение признаков: на этом этапе для каждого входного изображения извлекаются признаки;
    2. Принятие решения: модуль решения выдает карту решений, в которой для каждого пикселя входного изображения есть вероятность, с которой этот пиксель более четкий, чем схожие с ним
    Архитектура сети

    Тестирование работы модели

    Исследователи сравнили предложенную GACN с SOTA алгоритмами. Ниже видно, что модель выдает сравнимые с state-of-the-art архитектурами результаты.

    Результаты сравнения моделей. Красным — средний скор топ-модели, Синим — средний скор второй по перформансу модели