fbpx
  • CURE-TSD-Real: датасет для проверки системы по распознаванию объектов

    CURE-TSD-Real содержит модифицированные изображения дорожных знаков, которые сложно распознать стандартным нейросетям. Дообучение модели на таком наборе данных позволит оценить устойчивость ее предсказаний. Датасет был собран исследователями из Georgia Tech. Исследователи собрали изображения дорожных знаков и аугментировали данные с помощью алгоритма.

    Что внутри

    CURE-TSD-Real состоит из 2,989 видеозаписей, в которых содержится ~650,000 аннотированных знаков. Дорожные знаки были засняты при разных условиях: дождь, снег, затемненное время суток, туман, отсвечивание, нарушение цвета, расплывчатость, грязная линза камеры, окклюзия и пасмурная погода. Видеосъемка велась на дорогах Бельгии. 

    Типы дорожных знаков в датасете

    Датасет организован по уровням. Чем выше уровень, тем выше процент шума в изображениях и тем сложнее модели на нем обучаться.

    Тестирование

    Для оценки того, как хорошо нейросети могут распознавать знаки из CURE-TSD-Real, исследователи обучили топ-2 архитектуры из соревнования VIP Cup traffic sign detection. Обе модели основаны на сверточных нейросетях. Первая имеет в основе VGG и ResNet. Вторая — GoogLeNet и кастомную CNN.

    Результаты тестов показали, что наличие неблагоприятных условий съемки при записи видео сокращает точность предсказаний модели на 20-60%. Это зависит от той метрики точности, которая используется. Такие условия, как тени на видео в меньшей степени влияют на качество предсказаний модели — уменьшают на 16%. В то время как ошибки, связанные с кодировкой видео, сокращают точность модели на 80%.