fbpx
  • CO3D: датасет с трехмерными реконструкциями объектов

    FAIR представил CO3D — датасет, содержащий точные трехмерные реконструкции 19 000 реальных объектов. Датасет предназначен для использования в задачах дополненной реальности и при разработке игр.

    Common Objects in 3D (CO3D) содержит 1,5 миллиона кадров из почти 19 000 видеороликов, в которых запечатлены объекты из 50 категорий датасета MS-COCO. CO3D превосходит аналогичные датасеты как по количеству категорий, так и по количеству объектов.

    Для сбора данных в FAIR использовали COLMAP, фреймворк для фотограмметрии, требующий изображений каждого объекта, снятых с различных ракурсов. COLMAP формирует трехмерную реконструкцию объекта путем отслеживания положения камеры и формирования плотного облака точек, задающих поверхность объекта. После этого в FAIR использовали полуавтоматический алгоритм активного обучения, который отфильтровывает видео с недостаточной точностью 3D-реконструкции.

    Эти фотографии были получены с помощью краудсорсинг-платформы Amazon Mechanical Turk. Работникам предлагалось выбрать объект определенной категории, поместить его на твердую поверхность и с помощью смартфона записать видео, сохраняя весь объект в поле зрения при движении смартфона по кругу.

    Датасет доступен по ссылке.

    Подписаться
    Уведомить о
    guest
    0 Comments
    Межтекстовые Отзывы
    Посмотреть все комментарии