LambdaNetworks: новая архитектура для задач компьютерного зрения

LambdaNetworks — это нейросетевая архитектура, которая способна захватывать длительные зависимости между входными данными и контекстуальной информацией. Например, пиксель, окруженный другими пикселями. Итоговая архитектура LambdaNetwork требует меньше вычислительных ресурсов и является простой в имплементации в сравнении с альтернативными подходами.

Подробнее про особенности LambdaNetworks

Ключевая особенность структуры сети — это лямбда слой, который учитывает такие зависимости с помощью трансформации доступных контекстов в линейные функции (лямбды). Затем лямбды применяются к каждому входному объекту по отдельности. Лямбда слои могут быть имплементированы в модели для глобальных, локальных и маскированных контекстов. 

Линейные функции противопоставляются картам внимания, которые повсеместно используются в state-of-the-art нейросетевых архитектурах. Карты внимания являются дорогими для вычисления. 

Тестирование подхода

Исследователи проводили эксперименты на трех задачах: классификации изображений на данных ImageNet и распознавание объектов и instance сегментация на данных COCO. LambdaNetworks обходят сверточные архитектуры и архитектуры с механизмом внимания. При этом предложенные модели более вычислительно эффективны.

LambdaResNets — это семейство LambdaNetworks моделей, которые адаптированы под задачу классификации изображений. LambdaResNets выдают предсказания с state-of-the-art точностью на ImageNet при том, что обучаются в 4.5 раз быстрее EfficientNets.

Результаты LambdaResNets
Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt