LambdaNetworks — это нейросетевая архитектура, которая способна захватывать длительные зависимости между входными данными и контекстуальной информацией. Например, пиксель, окруженный другими пикселями. Итоговая архитектура LambdaNetwork требует меньше вычислительных ресурсов и является простой в имплементации в сравнении с альтернативными подходами.
Подробнее про особенности LambdaNetworks
Ключевая особенность структуры сети — это лямбда слой, который учитывает такие зависимости с помощью трансформации доступных контекстов в линейные функции (лямбды). Затем лямбды применяются к каждому входному объекту по отдельности. Лямбда слои могут быть имплементированы в модели для глобальных, локальных и маскированных контекстов.
Линейные функции противопоставляются картам внимания, которые повсеместно используются в state-of-the-art нейросетевых архитектурах. Карты внимания являются дорогими для вычисления.
Тестирование подхода
Исследователи проводили эксперименты на трех задачах: классификации изображений на данных ImageNet и распознавание объектов и instance сегментация на данных COCO. LambdaNetworks обходят сверточные архитектуры и архитектуры с механизмом внимания. При этом предложенные модели более вычислительно эффективны.
LambdaResNets — это семейство LambdaNetworks моделей, которые адаптированы под задачу классификации изображений. LambdaResNets выдают предсказания с state-of-the-art точностью на ImageNet при том, что обучаются в 4.5 раз быстрее EfficientNets.