Группа исследователей обучили нейросетевую модель, которая распознает повреждения на снимках дорог. Модель работает для множества стран сразу. Исследователи собрали масштабный датасет с изображениями дорог из разных стран. Датасет состоит из 26 тысяч изображений.
С помощью собственного датасета совместно с существующими наборами данных исследователи обучили более устойчивые детекторы повреждений. Модели поделили на две группы:
- Модели, которые обучались на одном источнике данных (Single Source Models);
- Модели, которые обучали на одном источнике данных и тестировали на гетерогенных данных (Multiple Source Models)
Эксперименты проводили отдельно для каждой целевой страны: Япония, Индия и Чехия. По результатам экспериментов, модели, которые обучали на одном гомогенном источнике данных, не справлялись с данными, которые не были похожи на те, что были в обучающей выборке. При этом обобщающая способность не росла с увеличением количества данных в обучающей выборке. Для Multiple Source моделей качество предсказания варьировалось в зависимости от целевой страны.
Собранный датасет был опубликован на GitHub. Детальную информацию об архитектуре подхода и экспериментах можно найти в оригинальной статье.