BMW Group представила SORDI – крупнейший open-source датасет размеченных фотореалистичных изображений заводов и других производств. SORDI содержит более 800 000 изображений в 80 категориях и нацелен на развитие методов машинного обучения на производствах.
Датасет разработан совместно с Microsoft, NVIDIA и idealworks. Метки на изображениях позволяют выполнять ключевые задачи обработки изображений, такие как классификация, обнаружение объектов или сегментация.
Изображения в датасете разделены на 80 категорий в зависимости от типа содержащих их объектов и включают изображения поддонов, каркасов, вилочных погрузчиков, и других объектов, используемых в сферах автомобилестроения и логистики.
Для автоматизированного сбора датасета использовалась симуляция сцен с производств, созданная в NVIDIA Omniverse. Система позволяет синтезировать любое количество фотореалистичных.
В BMW Group датасет уже используется для контроля качества на заводах компании, а также разработки и адаптации новых моделей.