fbpx
  • CompressAI: библиотека для оценки моделей сжатия данных

    CompressAI — это опенсорсная библиотека и платформа для оценки моделей сжатия данных. Инструмент основан на фреймворке для глубокого обучения PyTorch. Задача сжатия данных состоит в том, что бы минимизировать размер данных и при этом максимально сохранить информацию.

    Подробнее про библиотеку

    На данный момент CompressAI предоставляет:

    • Кастомные операции, слои и нейросетевые модели для сжатия данных;
    • Часть функционала из официальной библиотеки на TensorFlow для сжатия;
    • Предобученные end-to-end модели сжатия для задачи сжатия изображений;
    • Скрипты для оценки и сравнения обученных моделей с классическими методами сжатия фото- и видеоданных

    Текущая версия библиотеки не поддерживает обучение с использованием нескольких GPU. Однако разработчики планируют добавить этот функционал в будущие версии библиотеки.

    Доступные модели

    Нейросети в CompressAI обучали в течении 4-5 миллионов шагов на патчах изображений размером 256×256, которые были случайно извлечены и обрезаны из изображений в датасете Vimeo90K. Модели обучали с размером батча в 16 или 32. В среднем, чтобы достичь state-of-the-art качества, модели обучались от одной до двух недель в зависимости от используемых GPU.

    В текущей версии доступны 6 архитектур:

    • mshj2018_factorized;
    • bmshj2018_hyperprior;
    • mbt2018_mean;
    • mbt2018;
    • cheng2020_anchor
    • cheng2020_attn

    Разработчики также опубликовали тьюториалы по работе с библиотекой в официальном репозитории на GitHub.