PixelSSL: библиотека для pixel-wise задач компьютерного зрения

PixelSSL — это библиотека для попиксельных задач компьютерного зрения. Библиотека облегчает обучение моделей с частичным привлечением учителя (semi-supervised). На данный момент PixelSSL поддерживает только задачу сегментации объектов. В библиотеки доступны реализации 5 моделей: SupOnly, MT, S4L, AdvSSL и GCT. 

Подробнее про библиотеку

Цель PixelSSL заключается в том, что бы продвигать исследование и применение semi-supervised обучения для решения CV-задач на уровне пикселей. Двумя основными функциями библиотеки являются:

  1. Интерфейс для имплементации новых semi-supervised алгоритмов;
  2. Шаблон для использования semi-supervised методов при решении CV-задач

Архитектура GCT

GCT — это semi-supervised нейросеть, которую разработали создатели PixelSSL. Модули в GCT выучиваются на неразмеченных данных совместно с помощью двух предложенных ограничений, которые не зависят от задачи. Нейросеть можно применять на pixel-wise задачах без структурных изменений. По результатам экспериментов, модель обходит state-of-the-art semi-supervised подходы на четырех задачах: семантической сегментации, расшумления изображения, матирования портрета и улучшения качества ночного изображения.

Нейросеть состоит из двух моделей и детектора ошибок. Две модели обучаются на неразмеченных данных и принимают во внимания то, что выдает детектор ошибок. Детектор ошибок во время обучения использует размеченные данные.

Визуализация процесса обучения нейросети на примере задачи семантической сегментации
Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt