fbpx
  • Asteroid: библиотека для разделения аудиозаписи на дорожки

    Asteroid  — это библиотека для разделения аудиозаписи на дорожки. Библиотека основана на Pytorch. Asteroid сокращает время на проведение экспериментов на популярных датасетах в обработке звука. Инструмент находится в открытом доступе в репозитории на GitHub. Asteroid поддерживает широкий набор датасетов, архитектур и имплементаций ключевых подходов для разделения звука на дорожки. Кроме того, разработчики опубликовали тьюториалы по использованию библиотеки.

    На данные момент в библиотеке доступны следующие подходы к разделению аудиозаписи:

    •  ConvTasnet (Luo et al.)
    •  Tasnet (Luo et al.)
    •  Deep clustering (Hershey et al. and Isik et al.)
    •  Chimera ++ (Luo et al. and Wang et al.)
    •  DualPathRNN (Luo et al.)
    •  Two step learning(Tzinis et al.)
    •  Open-Unmix (coming) (Stöter et al.)
    •  Wavesplit (coming) (Zeghidour et al.)

    Поддерживаемые датасеты включают в себя: 

    •  WSJ0-2mix / WSJ03mix (Hershey et al.)
    •  WHAM (Wichern et al.)
    •  WHAMR (Maciejewski et al.)
    •  Microsoft DNS Challenge (Chandan et al.)
    •  SMS_WSJ (Drude et al.)
    •  MUSDB18 (egs coming) (Raffi et al.)
    •  FUSS (egs coming) (Wisdom et al.)
    •  AVSpeech (Ephrat et al.)
    •  Kinect-WSJ (Sivasankaran et al.)