CompressAI — это опенсорсная библиотека и платформа для оценки моделей сжатия данных. Инструмент основан на фреймворке для глубокого обучения PyTorch. Задача сжатия данных состоит в том, что бы минимизировать размер данных и при этом максимально сохранить информацию.
Подробнее про библиотеку
На данный момент CompressAI предоставляет:
- Кастомные операции, слои и нейросетевые модели для сжатия данных;
- Часть функционала из официальной библиотеки на TensorFlow для сжатия;
- Предобученные end-to-end модели сжатия для задачи сжатия изображений;
- Скрипты для оценки и сравнения обученных моделей с классическими методами сжатия фото- и видеоданных
Текущая версия библиотеки не поддерживает обучение с использованием нескольких GPU. Однако разработчики планируют добавить этот функционал в будущие версии библиотеки.
Доступные модели
Нейросети в CompressAI обучали в течении 4-5 миллионов шагов на патчах изображений размером 256×256, которые были случайно извлечены и обрезаны из изображений в датасете Vimeo90K. Модели обучали с размером батча в 16 или 32. В среднем, чтобы достичь state-of-the-art качества, модели обучались от одной до двух недель в зависимости от используемых GPU.
В текущей версии доступны 6 архитектур:
- mshj2018_factorized;
- bmshj2018_hyperprior;
- mbt2018_mean;
- mbt2018;
- cheng2020_anchor
- cheng2020_attn
Разработчики также опубликовали тьюториалы по работе с библиотекой в официальном репозитории на GitHub.