DNS: соревнование по фильтрации шума на аудиозаписи от Microsoft

Deep Noise Suppression (DNS) — это соревнование по фильтрации шума на аудиозаписи от Microsoft. Соревнование разработали для того, что бы спровоцировать исследования в области улучшения качества аудиозаписей через фильтрацию шума. Разработчики презентовали соревнование на INTERSPEECH и ICASSP 2020. В открытый доступ выложили обучающий и тестовый датасеты. Кроме того, в открытый доступ выложили фреймворк для оценки моделей. В обновленной версии соревнования расширили обучающую и тестовую выборки. Датасет собирали исследователи из Microsoft.

Подробнее про соревнование

Датасет для обучения с чистой речью состоит из 760.53 часов аудиозаписей: речь читающего человека (562.72 часов), поющий голос (8.80 часов), данные с эмоциями (3.6 часа), разговоры на китайском (185.41 часов).

Соревнование Deep Noise Suppression делится на два направления: wide band и full band сценарии. Модель для фильтрации шума должна обрабатывать часть аудиозаписи размером в T миллисекунд за ограниченное время на машине с четырьмя Intel Core i5 ядрами. Суммарная алгоритмическая задержка, которая разрешена, составляет меньше 40 миллисекунд.

Например, для системы, которая работает в реальном времени и получает аудиозаписи по 20 миллисекунд, алгоритмическая задержка может быть максимум 30 секунд.

Больше информации о деталях соревнования — в оригинальной статье.

Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt