fbpx
  • GAN не справляется с генерацией оптических иллюзий

    Нейронные сети хорошо показывают себя в задачах распознавания лиц и объектов на изображениях. Им под силу даже генерация реалистичных изображений. Ученые предположили, что это сработает и в случае с оптическими иллюзиями. Однако распознавание и создание иллюзий оказалось сложной задачей для алгоритмов компьютерного зрения.

    Датасеты

    Механизм возникновения и восприятия оптических иллюзий плохо изучен, поэтому даже сбор данных для обучения представляет сложность. Ученые из Луисвиллского университета создали два датасета с оптическими иллюзиями. Первый собран с двух сайтов и содержит 6752 изображения. Второй содержит 500 вручную отобранных изображений. Датасеты упорядочены по категориям и классам и доступны к скачиванию в облачной платформе FloydHub.

    Эксперимент и результаты

    Исследователи протестировали генеративно-состязательную нейросеть после 7 часов обучения на видеокарте NVIDIA Tesla K80, однако не достигли никаких значительных результатов — изображения, которые генерирует нейросеть мало похожи на оптические иллюзии. Учёные предполагают, что результат можно незначительно улучшить, изменяя настройки гиперпараметров и обучив нейросеть на большем наборе данных.

    При этом, команда также пришла к выводу, что для качественной генерации иллюзий только увеличения набора данных будет недостаточно. Модели необходимо более глубокое понимание принципов человеческого зрения, чтобы сгенерировать паттерн, который может его обмануть. В этом может помочь метод проверки результатов с обратной связью.