Чем отличается процесс принятия решений у нейросети и ребенка

Facebook AI опубликовали работу, в которой проверяли нейросети на способность следовать принципу взаимной исключительности при принятии решений. Если поставить перед ребенком незнакомый предмет и знакомый и спросить, что из них является предметом, название которого он не знает, ребенок присвоит незнакомую категорию незнакомому объекту. При этом нейросетевые модели не выучивают, что категория у объекта может быть только одна. Исследователи подчеркивают потребность в проектировании нейросетей с подобными индуктивными предубеждениями.

Сильные индуктивные предубеждения позволяют детям учиться быстро и адаптироваться к изменениям среды. Дети для этого используют принцип взаимной исключительности (mutual exclusivity). Благодаря ему, детям проще выучивать связи между словами. Взаимная исключительность предполагает, что если объект принадлежит к одной группе, ему не нужно присваивать еще одну. Фокус исследования в том, чтобы проверить, способны ли стандартные нейросетевые архитектуры к взаимной исключительности.

Иллюстрация принципа взаимной исключительности. Если перед ребенком незнакомый предмет и знакомый и спросить, что из них является предметом, название которого он не знает, ребенок присвоит незнакомую категорию незнакомому объекту

Как оценить нейросеть

Предполагается, что у модели есть знакомые ей и незнакомые предметы. У каждого предмета есть название (категорий) и изображение объекта.

Как оценивается seq2seq модель:

После того как модель обучена на выборке знакомых объектов, незнакомый объект поступает на вход модели как вектор признаков;
Сеть сопоставляет вектор незнакомого объекта с вектором изображения через скрытый слой между ними

Большая часть вероятности распределяется между ранее известными модели объектами.

Как оценивается полносвязная модель:

Похожий пайплайн, как у seq2seq модели;
На этапе тестирования незнакомый объект кодируется и рассчитывается его ME (mutual exclusivity) метрика

Оценка способности модели к взаимной исключительности на seq2seq (a) структуре и на полносвязной нейросети (b)

Взаимная исключительность на задаче классификации

Исследователи проверили нейросетевые модели на нескольких задачах. Для задачи классификации датасет состоял из 100 пар слово-изображение, которые были закодированы в вектора размером 100. Модель тренировалась на 90 парах, а 10 отводились для тестирования. Для каждого тестового объекта рассчитывалась его ME метрика. Рассчитанная ME метрика сравнивалась с максимально возможной.

Всего было оценено около 400 моделей, но подробное описание архитектур отсутствует. Ниже видно, что нейросеть, даже с использованием дополнительных апгрейдов, плохо справлялась с классификацией незнакомых объектов.

Сравнение реальной взаимной исключительности модели и идеальной (синим)

Facebook AI

Как оценить нейросеть

Взаимная исключительность на задаче классификации

Читайте также