Waymo публикуют датасет для обучения моделей автопилотных автомобилей. Датасет будет включать в себя видеозаписи вождения с размеченными объектами. Компания Waymo разрабатывает автопилотные автомобили с 2009 года и входит в группу компаний Alphabet. Чтобы следить за релизом, можно оставить почту на официальном сайте.
Компания презентовала датасет на главной конференции по компьютерному зрению CVPR 2019. Главный исследователь Waymo на воркшопе по автопилотным автомобилям сказал, что открытые датасеты (напр., KITTI) слишком маленькие и недостаточно разнообразные. Модели, обученные на открытых данных, обладают недостаточной обобщающей способностью. Это было основной мотивацией, чтобы создать открытый датасет для обучения моделей компьютерного зрения.
Waymo Open Dataset
Данные включают в себя 3,000 видеозаписей вождения, которые в сумме длятся 16.7 часов, 600,000 фреймов, около 25 миллионов 3D границ объектов и 22 миллионов 2D границ объектов. Сенсоры на автомобилях, которые собирали данные, включали в себя 5 LiDARs, 5 камер и радары, количество которых не разглашается. Компания заявила, что им удалось точнее синхронизировать LiDAR и записи камер, чем в открытых данных (KITTI, NuScenes)
Чтобы исключить проблему однообразия видеозаписей, записи в Waymo Open Dataset велись при различных условиях. Среди параметров видеозаписей — такие, как погода, пешеходы, освещение, велосипедисты и стройка. Разнообразие в данных повышает генерализующую способность моделей, которые на них обучаются.
Первая часть датасета будет опубликована в июле. В нее войдет треть от всех видеозаписей (1,000 видео). Компания запустит соревнование и опубликует результаты базовых моделей для решения задач.
Следить за обновлениями можно на официальном сайте проекта.