fbpx
  • LambdaNetworks: новая архитектура для задач компьютерного зрения

    LambdaNetworks — это нейросетевая архитектура, которая способна захватывать длительные зависимости между входными данными и контекстуальной информацией. Например, пиксель, окруженный другими пикселями. Итоговая архитектура LambdaNetwork требует меньше вычислительных ресурсов и является простой в имплементации в сравнении с альтернативными подходами.

    Подробнее про особенности LambdaNetworks

    Ключевая особенность структуры сети — это лямбда слой, который учитывает такие зависимости с помощью трансформации доступных контекстов в линейные функции (лямбды). Затем лямбды применяются к каждому входному объекту по отдельности. Лямбда слои могут быть имплементированы в модели для глобальных, локальных и маскированных контекстов. 

    Линейные функции противопоставляются картам внимания, которые повсеместно используются в state-of-the-art нейросетевых архитектурах. Карты внимания являются дорогими для вычисления. 

    Тестирование подхода

    Исследователи проводили эксперименты на трех задачах: классификации изображений на данных ImageNet и распознавание объектов и instance сегментация на данных COCO. LambdaNetworks обходят сверточные архитектуры и архитектуры с механизмом внимания. При этом предложенные модели более вычислительно эффективны.

    LambdaResNets — это семейство LambdaNetworks моделей, которые адаптированы под задачу классификации изображений. LambdaResNets выдают предсказания с state-of-the-art точностью на ImageNet при том, что обучаются в 4.5 раз быстрее EfficientNets.

    Результаты LambdaResNets
    Подписаться
    Уведомить о
    guest
    0 Comments
    Межтекстовые Отзывы
    Посмотреть все комментарии