PixelSSL — это библиотека для попиксельных задач компьютерного зрения. Библиотека облегчает обучение моделей с частичным привлечением учителя (semi-supervised). На данный момент PixelSSL поддерживает только задачу сегментации объектов. В библиотеки доступны реализации 5 моделей: SupOnly, MT, S4L, AdvSSL и GCT.
Подробнее про библиотеку
Цель PixelSSL заключается в том, что бы продвигать исследование и применение semi-supervised обучения для решения CV-задач на уровне пикселей. Двумя основными функциями библиотеки являются:
- Интерфейс для имплементации новых semi-supervised алгоритмов;
- Шаблон для использования semi-supervised методов при решении CV-задач
Архитектура GCT
GCT — это semi-supervised нейросеть, которую разработали создатели PixelSSL. Модули в GCT выучиваются на неразмеченных данных совместно с помощью двух предложенных ограничений, которые не зависят от задачи. Нейросеть можно применять на pixel-wise задачах без структурных изменений. По результатам экспериментов, модель обходит state-of-the-art semi-supervised подходы на четырех задачах: семантической сегментации, расшумления изображения, матирования портрета и улучшения качества ночного изображения.
Нейросеть состоит из двух моделей и детектора ошибок. Две модели обучаются на неразмеченных данных и принимают во внимания то, что выдает детектор ошибок. Детектор ошибок во время обучения использует размеченные данные.