Как в Gfycat решали проблему распознавания лиц азиатов и афроамериканцев

Гуманно ли ставить такой вопрос? Последнее исследование показало, что расовые различия учитываются разработчиками нейросетей при распознавании лиц. Формально же считается, что все люди равны и предвзятости в этом вопросе следует избегать, если не хочешь слышать в свой адрес обвинения в расизме.

Программный инженер компании Gfycat Генри Ган рассказал, что прошлым летом ПО с 90% точностью идентифицировало большинство его коллег, но столкнулась с трудностями при распознавании лиц одной группы.

“Лица некоторых наших азиатских сотрудников перепутались. Это было странно, потому что остальных программа опознала верно”, — говорит Ган.

У больших компаний возникли сходные проблемы. В Microsoft и IBM утверждают, что лица белых мужчин определяются с 95% точностью, а лица темнокожих женщин — в 10 раз хуже. Служба фотографий Google не реагирует на запросы “горилла”, “шимпанзе” или “обезьяна”. Таким образом, исключается повторение конфуза 2015 года, когда поисковик ошибочно принимал темнокожих людей на фото за обезьян. Единого стандарта выявления и устранения предвзятости в сетях ИИ еще не сложилось.

“Многие компании сейчас серьезно относятся к этим вещам, но учебник по их исправлению еще не написан”, — говорит Мередит Уиттакер, соруководитель AI Now.

Gfycat занялись распознаванием лиц, чтобы создать нейросеть, которая позволила бы людям быстро находить нужные GIFки для ответов в мессенджерах. Поисковая система компании анализирует около 50 миллионов GIF-файлов — от котиков до лиц президентов. С помощью распознавания лиц разработчики упростили поиск известных личностей от политиков до “звезд”.

“Азиатский детектор”

В Gfycat использовали нейросеть для распознавания лиц с открытым исходным кодом, основанную на исследованиях Microsoft. Разработчики обучили ее на миллионах фотографий из коллекции университетов штата Иллинойс и Оксфорда. Но нейросеть не смогла различить азиатских знаменитостей, таких как Constance Wu и Lucy Liu, и плохо различала людей с темной кожей.

Сначала Ган решал проблему путем обучения нейросети на большем числе примеров “проблемных” лиц. Увеличение числа фото чернокожих и азиатских знаменитостей в датасете помогло лишь частично.

Значительного прогресса удалось добиться благодаря “азиатскому детектору”. Обнаружив азиатское лицо, нейросеть переходила в режим повышенной чувствительности. По словам Гана, это оказался единственный способ заставить программу отличать азиатов друг от друга. Он утверждает, что нейросеть на 98% точна при опознавании белых людей, и на 93% при работе с лицами азиатов. Намеренный поиск расовых различий отчасти выглядит странным способом борьбы с предвзятостью. Несмотря на это, идею поддержал ряд ученых и компаний.

В декабре Google опубликовал отчет об успехах в точности распознавания улыбок при помощи определения пола и расовой группы человека на фото. В отчете также говорится, что нейросети не должны использоваться для определения расы, и что использовать только две гендерные и четыре расовые категории недостаточно.

Некоторые исследователи предложили сформировать отраслевые стандарты прозрачности и борьбы с предвзятостью нейросетей. Так, Эрик Лернед-Миллер, профессор Массачусетского университета, предлагает обязать организации, которые занимаются распознаванием лиц, раскрывать точность нейросетей при определении расы и пола человека. В число этих организаций входят Facebook и ФБР.

Источник: Wired

Распознавание лиц

“Азиатский детектор”

Читайте также