fbpx
  • Intel выпустила open source инструмент для разметки фото и видео

    Computer Vision Annotation Toolбесплатный интерактивный инструмент для разметки цифровых фото и видео от компании Intel. Исходный код доступен на GitHub.

    Исследователи data science нуждаются в большом количестве аннотированных данных для обучения глубоких нейронных сетей. Разметка данных занимает очень много времени. В блоге Intel написано, что команде понадобилось больше 3000 часов, чтобы аннотировать 769 000 объектов нужных только для одного из алгоритмов, который разрабатывает компания. Поэтому разработчики решили внести свой вклад в создание инструментов и ускорить процесс разметки данных для обучения моделей.

    Возможности Computer Vision Annotation Tool

    Программа поддерживает аннотацию изображений для обучения алгоритмов обнаружению объектов, сегментации и классификации изображений.

    Доступны 4 типа фигур для разметки:

    • прямоугольники;
    • многоугольники (в том числе для задач сегментации);
    • полилинии (для аннотирования разметки на дорогах);
    • точки (для разметки лица и оценки поз).

    CVAT предоставляет ряд функций для автоматизации процесса: копирование объектов, интерполяцию и автоматическое аннотирование с использованием TensorFlow Object Detection API, визуальные настройки, ярлыки, фильтры и т.д.

    Инструмент доступен для развертывания в браузере через Docker и поддерживает встраивание в платформы, например Onepanel. Он подходит и для командной работы. Есть возможность создавать публичные задачи и распределять их между пользователями.

    Intel использует платформу для аннотирования миллионов объектов. Разработчики записали несколько видеопримеров, демонстрирующих работу с инструментом в разных режимах: интерполяция, аннотация атрибутов, сегментацияРуководство по использованию Computer Vision Annotation Tool доступно здесь.