Генератор синтетических изображений для обучения моделей классификации

Исследователи MIT разработали метод, в котором контролируемый генератор синтетических изображений интегрируется в модель классификации. Метод позволяет сократить затраты на сбор крупномасштабных датасетов.

Создание датасетов для классификации может стоить миллионы долларов. Однако для некоторых задач пригодные данные в принципе не существуют, а даже лучшие датасеты часто подвержены проблеме смещения.

Чтобы обойти данные сложности, ученые MIT предложили вместо использования датасетов генерировать реалистичные синтетические данных, которые могут обучать модель классификации. Их результаты показывают, что модель контрастного обучения, обученная с использованием только синтетических данных, способна изучать визуальные представления, которые конкурируют или даже превосходят те, которые были получены на реальных данных.

Одним из ключевых преимуществ такой модели является многократное уменьшение количества памяти, требуемого для хранения датасета. Использование синтетических данных также может обойти некоторые проблемы, связанные с конфиденциальностью и вопросами авторского права, которые ограничивают возможность распространения некоторых реальных данных.

Генеративную модель также можно отредактировать, чтобы удалить определенные атрибуты, такие как раса или пол, что поможет устранить некоторые предубеждения, существующие в традиционных датасетах.