fbpx
  • В СПбПУ создают алгоритм, имитирующий слуховой нерв

    классификатор, имитирующий слуховой нерв

    В СПбПУ разрабатывают классификатор речевых потоков людей, говорящих в толпе или шумной обстановке. Алгоритм моделирует процесс рецепторного кодирования звуков — так работает человеческий слуховой нерв. Метод можно использовать в задачах нейрокомпьютерной разработки, распознавания речи, восстановления слуха.

    Обработка акустических сигналов

    Нервная система обрабатывает поступающую информацию в форме электрических сигналов. Периферические отделы нервной системы — зрительные и слуховые анализаторы — отвечают за восприятие и преобразование полученной из внешней среды информации в сигналы, которые распознает ЦНС — электрические импульсы. Так человек воспринимает речь собеседника даже в очень шумной обстановке.

    Исследователи с кафедры «Измерительные информационные технологии» Санкт-Петербургского Политеха разработали подход к анализу акустических сигналов на основе кодирования, которое использует периферическая нервная система. Они частично воспроизвели «алгоритмы», выполняемые нервной системой и интегрировали этот процесс в модуль принятия решений, который определяет тип входящего сигнала. 

    Кластеризация реакций слухового нерва на две фонемы
    Кластеризация реакций слухового нерва на две фонемы

    «Основная цель — дать аппарату человеческий слух и достичь соответствующего уровня восприятия машиной акустических сигналов в реальной среде», — сказал руководитель проекта Антон Яковенко.

    Модель слухового нерва

    Команда создала модель слухового нерва и получила большую выборку образцов сигналов нервной деятельности для гласных фонем. Подход сочетает нейронные сети и теорию графов. Алгоритм в шумной обстановке выявляет признаки, описывающих каждую фонему, ориентируясь на гласные звуки.

    Результат превосходит по качеству распространенные методы параметризации акустических сигналов.

    По словам Яковенко, алгоритмы обработки и анализа данных, реализованные в рамках исследования, универсальны и могут быть использоваться для решения задач, не связанных с обработкой акустического сигнала.