DAF:re: публичный датасет для распознавания аниме персонажей

DAF:re — это публичный датасет для распознавания аниме персонажей. Датасет состоит из 500 тысяч изображений с 3000 классов объектов. Данные по классам распределены неравномерно. Кроме того, исследователи протестировали ResNet и Visual Transformer модели на датасете. Код проекта доступен в открытом репозитории на GitHub.

Подробнее про датасет

DAF:re базируется на датасете DanbooruAnimeFaces (DAF), который является сабсетом датасета Danbooru2018. Danbooru2018 — это наиболее крупный размеченный датасет с аниме иллюстрациями. Данные извлекали из сервиса Danbooru. Danbooru — это хостинг для аниме иллюстраций с тэгами, которые проставляют пользователи.

В первой версии в Danbooru было 2.94 миллионов изображений с 77.5 миллионами тэгов. Затем датасет расширили до 3.33 миллионов изображений и 92.7 тэгов. Полная версия состоит из 3.69 миллионов изображений и 108 миллионов тэгов. Затем корпус отфильтровывали для задачи распознавания аниме персонажей. В отфильтрованном датасете содержатся 561 тысяча изображений, охватывающих 34 тысячи классов. DAF:re — это иначе отфильтрованный датасет Danbooru. Детали о процессе фильтрации доступны в оригинальной статье.

Распределение количества изображений по классам для топ-100 наиболее представленных классов объектов
Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

learn-neural-networks