Работа моделей компьютерного зрения зависит от качества разметки объектов в обучающих датасетах. На разметку одного изображения из COCO+Stuff у человека уходит 19 минут, значит для обработки всего набора данных потребуется 53 000 часов. Google AI представила инструмент Fluid Annotation, который поможет сократить время разметки одного изображения в три раза.
Как работает Fluid Annotation
Сначала изображение пропускается через подготовленную модель семантической сегментации Mask—RCNN, которая генерирует 1000 размеченных сегментов. Сегменты с наивысшим индексом доверия затем демонстрируются человеку. При работе с инструментом аннотатор может удалять существующие сегменты и добавлять новые, изменять подписи. Также можно редактировать карту глубины, если сегменты перекрывают друг друга.
Инструмент помогает значительно ускорить разметку изображений, которые затем могут использоваться при подготовке моделей машинного обучения для задач поиска изображений, в автономном вождении и робототехнике.
Команда представила разработку на ACM Multimedia Conference 2018, которая проходила 25 октября в Сеуле. Попробовать разметить границы объектов самостоятельно можно в демо—версии инструмента.