Разработчики из Оксфорда опубликовали нейросеть, которая распознает шимпанзе и определяет их пол на видеозаписи. Модель применима для исследования поведения и взаимодействия животных. Предложенный подход в два раза меньше ошибался, чем люди, которые размечали изображения.
Как обучалась модель
Источником данных были 50 часов видеозаписей с животными, которые были собраны за 14 лет. Из видеозаписей были извлечены 10 миллионов изображений 23-х шимпанзе. Итоговая модель способна распознать животное с точностью 93% и определить его пол с точностью 86%. Архитектура модели была основана на сверточных нейросетях.
Чтобы протестировать работу модели, исследователи дали час на разметку изображений людям и модели. Модель выдала в два раза меньше ошибок, чем аннотаторы. В другом эксперименте задачу по разметке дали новичкам и время увеличили до 2-х часов. По результатам, нейросеть оказалась в 4 раза более точной, чем ручная разметка. При этом время на разметку, которое затратила модель, составило около доли секунды.
Зачем это сделали
Исследователи животных чаще всего обращаются к видеозаписям как к источнику информации о поведении животных. Ручная обработка многолетних видеозаписей — рутинное и ресурсоемкое занятие. Помимо временных издержек, ручная разметка предполагает процент ошибки, который сложно оценить. Автоматизация разметки с помощью нейросетей решает большую часть проблем, связанных с обработкой видеоданных.
После обучения модели исследователи использовали ее для анализа взаимодействия группы шимпанзе. Модель выявила, что мать и дети проводят большую часть времени вместе. Это наблюдение полностью совпадает с описанными паттернами поведения животных.