Asteroid — это библиотека для разделения аудиозаписи на дорожки. Библиотека основана на Pytorch. Asteroid сокращает время на проведение экспериментов на популярных датасетах в обработке звука. Инструмент находится в открытом доступе в репозитории на GitHub. Asteroid поддерживает широкий набор датасетов, архитектур и имплементаций ключевых подходов для разделения звука на дорожки. Кроме того, разработчики опубликовали тьюториалы по использованию библиотеки.
На данные момент в библиотеке доступны следующие подходы к разделению аудиозаписи:
- ConvTasnet (Luo et al.)
- Tasnet (Luo et al.)
- Deep clustering (Hershey et al. and Isik et al.)
- Chimera ++ (Luo et al. and Wang et al.)
- DualPathRNN (Luo et al.)
- Two step learning(Tzinis et al.)
- Open-Unmix (coming) (Stöter et al.)
- Wavesplit (coming) (Zeghidour et al.)
Поддерживаемые датасеты включают в себя:
- WSJ0-2mix / WSJ03mix (Hershey et al.)
- WHAM (Wichern et al.)
- WHAMR (Maciejewski et al.)
- Microsoft DNS Challenge (Chandan et al.)
- SMS_WSJ (Drude et al.)
- MUSDB18 (egs coming) (Raffi et al.)
- FUSS (egs coming) (Wisdom et al.)
- AVSpeech (Ephrat et al.)
- Kinect-WSJ (Sivasankaran et al.)