Hypersim: синтетический датасет Apple с изображениями интерьеров

Apple представила Hypersim — синтетический датасет фотореалистичных изображений помещений и интерьеров. Hypersim состоит из 77 400 изображений 461 сцен и предоставляет семантическую сегментацию.

Основным ограничением синтетических датасетов является отсутствие в данных семантической сегментации — группировки пикселей на отдельные объекты. Также в большинстве таких датасетов не предоставляется разложение изображений на отдельные компоненты освещения и тени, что делает их непригодными для решения обратных задач рендеринга. Hypersim решает обе проблемы: датасет включает полную геометрию сцены, информацию о материалах поверхностей и освещении, а также семантическую сегментацию для каждого пикселя.

Границы каждого объекта задаются параллелепипедом, что позволяет использовать датасет в задачах распознавания предметов:

Hypersim создан на основе размещенных в открытом доступе трехмерных рендеров. Для каждого изображения предоставлено его разложение на три компонента: часть с диффузным отражением, часть с диффузным освещением и недиффузионную остаточную часть, содержащую эффекты освещения, зависящие от угла обзора.

Датасет и код для его генерации опубликованы в открытом доступе.

Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt