fbpx
  • DNS: соревнование по фильтрации шума на аудиозаписи от Microsoft

    Deep Noise Suppression (DNS) — это соревнование по фильтрации шума на аудиозаписи от Microsoft. Соревнование разработали для того, что бы спровоцировать исследования в области улучшения качества аудиозаписей через фильтрацию шума. Разработчики презентовали соревнование на INTERSPEECH и ICASSP 2020. В открытый доступ выложили обучающий и тестовый датасеты. Кроме того, в открытый доступ выложили фреймворк для оценки моделей. В обновленной версии соревнования расширили обучающую и тестовую выборки. Датасет собирали исследователи из Microsoft.

    Подробнее про соревнование

    Датасет для обучения с чистой речью состоит из 760.53 часов аудиозаписей: речь читающего человека (562.72 часов), поющий голос (8.80 часов), данные с эмоциями (3.6 часа), разговоры на китайском (185.41 часов).

    Соревнование Deep Noise Suppression делится на два направления: wide band и full band сценарии. Модель для фильтрации шума должна обрабатывать часть аудиозаписи размером в T миллисекунд за ограниченное время на машине с четырьмя Intel Core i5 ядрами. Суммарная алгоритмическая задержка, которая разрешена, составляет меньше 40 миллисекунд.

    Например, для системы, которая работает в реальном времени и получает аудиозаписи по 20 миллисекунд, алгоритмическая задержка может быть максимум 30 секунд.

    Больше информации о деталях соревнования — в оригинальной статье.

    Подписаться
    Уведомить о
    guest
    0 Comments
    Межтекстовые Отзывы
    Посмотреть все комментарии