Fluid Annotation - инструмент для разметки изображений от Google AI

Работа моделей компьютерного зрения зависит от качества разметки объектов в обучающих датасетах. На разметку одного изображения из COCO+Stuff у человека уходит 19 минут, значит для обработки всего набора данных потребуется 53 000 часов. Google AI представила инструмент Fluid Annotation, который поможет сократить время разметки одного изображения в три раза.

Как работает Fluid Annotation

Сначала изображение пропускается через подготовленную модель семантической сегментации Mask—RCNN, которая генерирует 1000 размеченных сегментов. Сегменты с наивысшим индексом доверия затем демонстрируются человеку. При работе с инструментом аннотатор может удалять существующие сегменты и добавлять новые, изменять подписи. Также можно редактировать карту глубины, если сегменты перекрывают друг друга.

Инструмент помогает значительно ускорить разметку изображений, которые затем могут использоваться при подготовке моделей машинного обучения для задач поиска изображений, в автономном вождении и робототехнике.

Команда представила разработку на ACM Multimedia Conference 2018, которая проходила 25 октября в Сеуле. Попробовать разметить границы объектов самостоятельно можно в демо—версии инструмента.

Google AI Сегментация

Как работает Fluid Annotation

Читайте также