fbpx
  • CORnet-S: нейросеть моделирует работу мозга при распознавании объектов

    CORnet-S — это нейросеть, которая распознает объекты похожим на мозг примата образом.  Архитектура CORnet-S похожа на устройство вентрального визуального потока приматов. Вентральный поток отвечает за распознавание и классификацию наблюдаемого объекта. Для сравнения модели с мозгом вводится метрика Brain-Score. Помимо CORnet-S, DenseNet и ResNet архитектуры получили наиболее высокий Brain-Score.

    Метрика похожести модели на мозг

    Исследователи опирались на гипотезу о двух потоках обработки зрительной информации. Основная идея модели в том, чтобы объединить машинное обучение и нейронауку. Для этого исследователи ввели метрику похожести модели на мозг (Brain-Score). Ниже видно, что наиболее схожими с мозгом являются DenseNet, CORnet-S и ResNet архитектуры. Brain-Score измеряет, как хорошо модель предсказывает нервный отклик в зонах мозга, которые отвечают за распознавание объекта и его категории (V4 и IT). В Brain-Score модель сравнивается с зонами зрительной коры примата.

    Процесс сравнения работы модели и мозга. Зеленые точки представляют популярные нейросетевые архитектуры, серые соответствуют различным мелким базовым моделям, которые показывают связь между точностью модели на ImageNet задаче и Brain-Score метрикой

    Архитектура CORnet-S состоит из 4 зон, которые соответствуют зонам кортикальной системы —  V1, V2, V4 и inferior temporal cortex (IT) в вентральном потоке. V1 — это полносвязный кодировщик, который снижает размерность входного изображения. V2, V4 и IT рекуррентны внутри слоя. Это дает возможность сократить количество слоев модели и добавить skip-связи. Решение добавить skip-связи следует из того, что ResNets и DenseNets архитектуры получили высокий Brain-Score. Подробное описание эксперимента и мотивации за разработкой модели можно найти в оригинальной статье.

    CORnet-S vs. state-of-the-art в распознавании объектов

    Исследователи сравнили CORnet-S с стандартными подходами для распознавания объектов: AlexNet, VGG, ResNet, Inception, SqueezeNet, DenseNet, MobileNet и (P)NASNet. Ниже видно, что CORnet-S при наиболее высоком Brain-Score не обходит топ-модель для ImageNet. Наиболее схожие с CORnet-S результаты имеют DenseNet и ResNet.

    Сравнение качества моделей на ImageNet и их Brain-Score. Красным отмечена CORnet-S