Исследователи в Facebook AI разработали нейросеть, которая размечает дороги на спутниковых снимках. Map With AI — это инструмент для проверки разметки, которую сделала нейросеть. Модель разметила ранее не размеченные дороги в Тайланде — более 300 тыс. миль.
Создание точных карт на текущий момент требует большого количества временных и материальных ресурсов. С появлением изображений со спутников ситуация изменилась незначительно. Часть регионов в развивающихся странах остается не покрытой на картах мира. Чтобы минимизировать площадь непокрытой территории, Facebook AI разработали нейросеть, которая на небольшом количестве данных обучилась размечать дороги на спутниковых изображениях. Нейросеть учитывает различия в устройстве дорог в разных частях мира.
В инструменты для редактирования карт (Map with AI) входит RapiD. RapiD — это интерфейс для проверки и редактирования карт, которые разметила нейросеть.
Дороги в Тайланде были размечены за 18 месяцев. В половину меньше времени, чем на разметку потратила бы команда из 100 анотаторов на ручную разметку. Сейчас корректность разметки можно проверить на OpenStreetMap.
Разметка дорог
Для того, чтобы разметить дороги на спутниковых снимках, исследователи использовали сверточные нейросети на задаче семантической сегментации. Кроме этого, обучение проводилось на небольшом датасете размеченных данных.
Задача семантической сегментации изображения естественно ложится на задачу детекции дорог на снимке. Для решения была использована модифицированная версия архитектуры D-LinkNet. D-LinkNet выиграла соревнование DeepGlobe Satellite Road Extraction Challenge. Векторизация и пост-процессинг техники могут взять выход из нейросети и конвертировать его в векторы дорог, которые совместимы с базами геоданных.
Масштабирование и слабое обучение
Как часть проекта по разметке дорог в Тайланде у исследователей были эксперты, которые проверяли и корректировали предсказания нейросети. Ручная коррекция предсказаний затем использовалась как источник данных для обучения.
После проверки результатов оказалось, что несмотря на высокую точность предсказаний для тайских дорог, для других регионов нейросеть выдавала менее точные результаты. По этой причине разработчики собрали дополнительный сет данных. Датасет содержал 1.8 миллионов частей земли и покрывал территорию на 700 тысяч квадратных миль. Размеченные моделью данные доступны на OpenStreetMap.
Сейчас команда работает над валидацией и корректировкой результатов модели с помощью расширения RapiD. RapiD нужен для проверки разметки экспертами.