Asteroid: библиотека для разделения аудиозаписи на дорожки

Asteroid  — это библиотека для разделения аудиозаписи на дорожки. Библиотека основана на Pytorch. Asteroid сокращает время на проведение экспериментов на популярных датасетах в обработке звука. Инструмент находится в открытом доступе в репозитории на GitHub. Asteroid поддерживает широкий набор датасетов, архитектур и имплементаций ключевых подходов для разделения звука на дорожки. Кроме того, разработчики опубликовали тьюториалы по использованию библиотеки.

На данные момент в библиотеке доступны следующие подходы к разделению аудиозаписи:

  •  ConvTasnet (Luo et al.)
  •  Tasnet (Luo et al.)
  •  Deep clustering (Hershey et al. and Isik et al.)
  •  Chimera ++ (Luo et al. and Wang et al.)
  •  DualPathRNN (Luo et al.)
  •  Two step learning(Tzinis et al.)
  •  Open-Unmix (coming) (Stöter et al.)
  •  Wavesplit (coming) (Zeghidour et al.)

Поддерживаемые датасеты включают в себя: 

  •  WSJ0-2mix / WSJ03mix (Hershey et al.)
  •  WHAM (Wichern et al.)
  •  WHAMR (Maciejewski et al.)
  •  Microsoft DNS Challenge (Chandan et al.)
  •  SMS_WSJ (Drude et al.)
  •  MUSDB18 (egs coming) (Raffi et al.)
  •  FUSS (egs coming) (Wisdom et al.)
  •  AVSpeech (Ephrat et al.)
  •  Kinect-WSJ (Sivasankaran et al.)
Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt