LaSOT: масштабный датасет для моделей трекинга объектов

LaSOT — масштабный датасет для обучения и оценки моделей трекинга объектов. Датасет содержит 1.5 тысяч видеоклипов с объектами 85 разных классов. Всего в датасете более 3.87 миллионов кадров. Каждый клип содержит разметку для одного объекте. Границы объекта на кадрах размечали вручную. 

Описание проблемы

Несмотря на развитие подходов для визуального трекинга, разработка и последующая оценка моделей ограничивается недостатком датасетов, специально предназначенных для трекинга объектов.

Подробнее про датасет

LaSOT — это первый подробно размеченный бенчмарк для обучения и оценки моделей трекинга. Средняя длина видеоклипа в датасете — 2.5 тысяч кадров. При этом целевой объект может исчезать и заново появляться в кадре. Это усложняет для моделей процесс слежки за объектом. Длина видеозаписей позволяет тестировать подходы для продолжительного трекинга объектов. Каждая видеозапись дополнительно размечена текстовым описанием. 

Сравнение существующих датасетов для трекинга объектов по плотности разметки видеозаписей

Создатели протестировали 48 базовых трекеров на LaSOT. Результаты экспериментов и анализ доступны на сайте проекта.

Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt