Intel выпустила open source инструмент для разметки фото и видео

Computer Vision Annotation Tool — бесплатный интерактивный инструмент для разметки цифровых фото и видео от компании Intel. Исходный код доступен на GitHub.

Исследователи data science нуждаются в большом количестве аннотированных данных для обучения глубоких нейронных сетей. Разметка данных занимает очень много времени. В блоге Intel написано, что команде понадобилось больше 3000 часов, чтобы аннотировать 769 000 объектов нужных только для одного из алгоритмов, который разрабатывает компания. Поэтому разработчики решили внести свой вклад в создание инструментов и ускорить процесс разметки данных для обучения моделей.

Возможности Computer Vision Annotation Tool

Программа поддерживает аннотацию изображений для обучения алгоритмов обнаружению объектов, сегментации и классификации изображений.

Доступны 4 типа фигур для разметки:

прямоугольники;
многоугольники (в том числе для задач сегментации);
полилинии (для аннотирования разметки на дорогах);
точки (для разметки лица и оценки поз).

CVAT предоставляет ряд функций для автоматизации процесса: копирование объектов, интерполяцию и автоматическое аннотирование с использованием TensorFlow Object Detection API, визуальные настройки, ярлыки, фильтры и т.д.

Инструмент доступен для развертывания в браузере через Docker и поддерживает встраивание в платформы, например Onepanel. Он подходит и для командной работы. Есть возможность создавать публичные задачи и распределять их между пользователями.

Intel использует платформу для аннотирования миллионов объектов. Разработчики записали несколько видео—примеров, демонстрирующих работу с инструментом в разных режимах: интерполяция, аннотация атрибутов, сегментация. Руководство по использованию Computer Vision Annotation Tool доступно здесь.

Intel Компьютерное зрение

Возможности Computer Vision Annotation Tool

Читайте также