Нейросеть предсказывает направленные границы объектов на изображениях с воздуха

Исследователи из Rutgers University предложили архитектуру сети, которая предсказывает направленные границы объектов на изображениях с воздуха. Модель выдает сравнимые с state-of-the-art подходами результаты.

Описание проблемы

Ориентированное распознавание объектов на изображениях с воздуха — это открытая задача, потому что объекты на таких изображениях располагаются плотно и могут быть направлены в любые стороны. Существующие методы для ориентированного распознавания объектов в основном полагаются на двухступенчатые детекторы, которые основаны на идее якорей (anchors). Ограничение таких детекторов заключается в проблеме дисбаланса границ объектов для позитивных и негативных якорей. Чтобы решить эту проблему, исследователи предлагают расширить горизонтальный детектор, основанный на ключевых точках (keypoints), для задачи ориентированно распознавания объектов.

Архитектура модели

Архитектура модели основывается на U-образной сети. Сначала модель распознает центральные ключевые точки объектов. На основе этих центральных точек затем предсказываются направленные векторы (BBAVectors), которые захватывают ориентированные границы объектов. BBAVectors распределены в четырех квадрантах, как в картезианской системе координат. Чтобы облегчить задачу обучения векторов для крайних случаев, ориентированные границы объектов затем классифицируются на горизонтальные или вращающиеся.

Оценка работы модели

Исследователи сравнили модель с state-of-the-art методами для распознавания объектов. Ниже видно, что предложенная модель, основанная на BBA векторах, выдает сравнимые с state-of-the-art подходами результаты.