fbpx
  • Нейросеть предсказывает направленные границы объектов на изображениях с воздуха

    Исследователи из Rutgers University предложили архитектуру сети, которая предсказывает направленные границы объектов на изображениях с воздуха. Модель выдает сравнимые с state-of-the-art подходами результаты.

    Описание проблемы

    Ориентированное распознавание объектов на изображениях с воздуха — это открытая задача, потому что объекты на таких изображениях располагаются плотно и могут быть направлены в любые стороны. Существующие методы для ориентированного распознавания объектов в основном полагаются на двухступенчатые детекторы, которые основаны на идее якорей (anchors). Ограничение таких детекторов заключается в проблеме дисбаланса границ объектов для позитивных и негативных якорей. Чтобы решить эту проблему, исследователи предлагают расширить горизонтальный детектор, основанный на ключевых точках (keypoints), для задачи ориентированно распознавания объектов.

    Архитектура модели

    Архитектура модели основывается на U-образной сети. Сначала модель распознает центральные ключевые точки объектов. На основе этих центральных точек затем предсказываются направленные векторы (BBAVectors), которые захватывают ориентированные границы объектов. BBAVectors распределены в четырех квадрантах, как в картезианской системе координат. Чтобы облегчить задачу обучения векторов для крайних случаев, ориентированные границы объектов затем классифицируются на горизонтальные или вращающиеся. 

    Визуализация составных частей модели

    Оценка работы модели

    Исследователи сравнили модель с state-of-the-art методами для распознавания объектов. Ниже видно, что предложенная модель, основанная на BBA векторах, выдает сравнимые с state-of-the-art подходами результаты.

    Сравнение конкурирующих подходов для распознавания объектов на изображениях с воздуха на датасете  DOTA-v1.0