Diversity in Faces — датасет от IBM с миллионом лиц для борьбы с предвзятостью алгоритмов

diversity faces dataset ibm
Фото: techcrunch.com

Diversity in Faces — большой и разнообразный набор данных, который содержит миллион изображений размеченных лиц людей. Открывая доступ к датасету, в IBM Research надеются повысить точность распознавания лиц людей разных рас, полов и возрастов и уменьшить предвзятость алгоритмов.

Исследователи уже работают с такими признаками, как возраст, пол и цвет кожи, но эти функции не обеспечивают достаточно разнообразия, чтобы охарактеризовать всех людей. По словам IBM, необходимо учитывать другие признаки, такие как симметрия лица, контраст, разрез и размер глаз, носа, лба и рта.

IBM dataset
Подробнее о составлении датасета — https://www.research.ibm.com/artificial-intelligence/trusted-ai/diversity-in-faces/documents/Diversity-in-Faces-Publication.pdf

В наборе Diversity in Faces ученые из IBM собрали миллион изображений лиц из другого крупного датасета — Flickr Creative Commons и аннотировали их с помощью 10 «устоявшихся и независимых» систем кодирования (методов оценки) из научных публикаций. Каждое кодирование включает разные объективные измерения: размер головы, контраст лица, длину носа, высоту лба, пропорции лица, возраст, пол и другие параметры и их соотношение друг к другу. Вместе эти измерения создают «отпечаток лица», который алгоритм будет использовать, например, для сопоставления нескольких фотографий одного и того же человека.

«Мы хотим, чтобы распознавание лиц работало точно для каждого из нас. Производительность не должна отличаться для разных людей или разных групп населения» — написали исследователи в статье. Разработчики не ожидают, что первая версия набора поможет полностью избежать предвзятости, но это — конечная цель.

Датасет Diversity in Faces предоставляется по запросу. Для получения доступа нужно заполнить анкету и отправить заявку. 

Читайте также:  Как в Gfycat решали проблему распознавания лиц азиатов и афроамериканцев

Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt