Hypersim — это датасет с фотореалистичными синтетическими изображениями интерьеров. Для каждого изображения доступны попиксельная разметка объектов и геометрия сцены. Датасет состоит из 77.4 тысяч изображений 461 сцены.
Проблема
Для многих задач понимания сцены сбор попиксельной разметки объектов на изображениях является сложным или невозможным. Исследователи из Apple опубликовали синтетический датасет, который решает проблему недостатка данных для обучения моделей в задачах, где требуются изображения интерьеров с геометрией сцены.
Подробнее про датасет
Hypersim отличается следующими характеристиками:
- Опирается исключительно на публично доступные 3D модели;
- Включает в себя полную геометрию сцены, информацию о материалах и освещении;
- Включает в себя попиксельную семантическую сегментацию для каждого изображения;
- Учитывает точку обзора на сцену при смене эффектов освещения
Получить доступ к данным можно в открытом репозитории на GitHub.