Многослойная нормализация улучшает точность распознавания эмоций

Новый алгоритм многослойной нормализации значительно увеличивает точность распознавания эмоций по сигналу электроэнцефалограммы (ЭЭГ) головного мозга. Нормализация признаков по различным участникам и экспериментам, лежащая в основе метода, позволяет снизить корреляции между распознанными эмоциями и отдельными участниками экспериментов.

Эффективность моделей машинного обучения, связанных с распознаванием эмоций на основе сигналов ЭЭГ, значительно ограничивает неоднородность данных, получаемых от разных пациентов, и даже данных одного и того же пациента, участвующего в нескольких экспериментах. Для решения этой проблемы в настоящее время используются методы, основанные на длительной и сложной калибровке показаний ЭЭГ отдельных пациентов. В новом исследовании предлагается альтернативный подход – алгоритм многослойной нормализации. Точность распознавания эмоций нейронными сетями, обученными с использованием многослойной нормализации, оказывается значительно выше по сравнению с сетями, обученными с использованием пакетной нормализации.

Новый метод, схема которого представлена на рис. 1, состоит в нормализации признаков по отдельным участникам и экспериментам. Для обучения модели исследователи использовали датасет, содержащий видеозаписи 15 пациентов, причем каждый пациент участвовал в трех экспериментах. В ходе одного эксперимента записывалось по 15 видео с одним пациентом. Всем видеозаписям была предварительно присвоена эмоция присутствующего на ней участника (положительная, отрицательная или нейтральная).

Рис. 1. Схема алгоритма многослойной нормализации.

Результаты работы нейронной сети без использования и с использованием многослойной нормализации приведены на рис. 2 и 3 соответственно. Как видно из рисунков, новый метод приводит к сильной локализации каждой из эмоций в распределении. Также происходит значительное снижение корреляций между распознанными эмоциями и отдельными участниками экспериментов. Данные результаты говорят о высокой эффективности метода для решения различных задач распознавания эмоций. Помимо этого, многослойная нормализация может использоваться для распознавания голоса и объектов.

Рис. 2. Распределение распознанных эмоций (слева) и участников экспериментов (справа) в нейронной сети, обученной с пакетной нормализацией.
Рис. 3. Распределение распознанных эмоций (слева) и участников экспериментов (справа) в нейронной сети, обученной с многослойной нормализацией.

ЭЭГ, в силу низкой стоимости и неинвазивности, является наиболее перспективным инструментом детектирования эмоций. Метод многослойной нормализации открывает новые возможности для распознавания эмоций, используемого в широком классе приложений, включая разработку интерфейсов мозг-компьютер, улучшение алгоритмов интерактивного повествования и диагностику аффективных расстройств.

Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt