fbpx
  • Products-10K: датасет для распознавания продуктов

    Products-10K — это широкомасштабный датасет для распознавания продуктов. Датасет состоит из изображений потребительских товаров. Данные собирали, чтобы улучшить качество моделей для распознавания товаров на складских полках.

    Проблемы прошлых датасетов

    Распознавание товаров является актуальной проблемой из-за широкого разнообразия товаров и их визуального сходства. Существующие датасеты с изображениями товаров либо слишком мелкие, либо с шумной разметкой. Products-10K состоит из 10 тысяч категорий товаров, которые часто приобретают пользователи JD.com. 

    Подробнее про датасет

    Изображения в Product-10K собирали из фотографий онлайн-магазина и изображений пользователей. Пользователи прикрепляли изображения к комментариям к приобретенному товару.

    Разные типы изображений в датасете

    Категории товаров в датасете включают в себя моду, еду, здравоохранение, домохозяйственные товары и другие. Классы в датасете организованы в виде графа, который захватывает иерархические связи между продуктами и их близость. Всего в датасете около 150 тысяч изображений. Все изображения вручную проверяли и размечали эксперты из JD.com. Общий уровень шума в данных не превышает 0.5%.