LaSOT: масштабный датасет для моделей трекинга объектов

15 сентября 2020

LaSOT: масштабный датасет для моделей трекинга объектов

LaSOT — масштабный датасет для обучения и оценки моделей трекинга объектов. Датасет содержит 1.5 тысяч видеоклипов с объектами 85 разных классов. Всего в датасете более 3.87 миллионов кадров. Каждый клип…

Products-10K: датасет для распознавания продуктов

1 сентября 2020

Products-10K: датасет для распознавания продуктов

Products-10K — это широкомасштабный датасет для распознавания продуктов. Датасет состоит из изображений потребительских товаров. Данные собирали, чтобы улучшить качество моделей для распознавания товаров на складских полках. Проблемы прошлых датасетов Распознавание…

Google AI опубликовали датасет для тестирования моделей на устойчивость к шуму

31 августа 2020

Google AI опубликовали датасет для тестирования моделей на устойчивость к шуму

Исследователи из Google AI опубликовали первый датасет для тестирования устойчивости моделей к шумным данным. Кроме датасета, исследователи опубликовали модель классификации для шумных данных. MentorMix обходит state-of-the-art подходы для шумных данных…

WebDataset: библиотека для работы с большими датасетами

21 августа 2020

WebDataset: библиотека для работы с большими датасетами

WebDataset — это открытая библиотека для PyTorch, которая упрощает работу с крупными датасетами для машинного обучения. В WebDataset датасет представляется в формате POSIX tar архивов. Библиотека напрямую использует эти архивы…

В FAIR нашли пересечения данных в популярных QA датасетах

15 августа 2020

В FAIR нашли пересечения данных в популярных QA датасетах

Задача open domain вопросно-ответных систем предполагает, что модель умеет отвечать на новые вопросы с помощью знаний, выученных во время обучения. Кроме того, модель должна уметь генерализовать имеющиеся знания для ответа…

CelebA-Spoof: масштабный датасет для антиспуфинга

5 августа 2020

CelebA-Spoof: масштабный датасет для антиспуфинга

CelebA-Spoof — это датасет для антиспуфинга, который состоит из 625,537 изображений 10,177 людей. Антиспуфинг лица — это методы борьбы с обманом систем по распознаванию лиц. Датасет включает в себя 43…

COCO-WholeBody: первый датасет для оценки позы всего тела

4 августа 2020

COCO-WholeBody: первый датасет для оценки позы всего тела

COCO-WholeBody — это первый датасет для оценки позы всего тела. COCO-WholeBody является расширением датасета COCO 2017 с теми же разбивками на тренировочную и валидационную выборки, как в COCO. Для каждого…

WordCraft: среда для тестирования здравого смысла у RL-агентов

4 августа 2020

WordCraft: среда для тестирования здравого смысла у RL-агентов

WordCraft — это среда для тестирования общих знаний о мире у RL-агентов. Среда основывается на видеоигре Little Alchemy 2. Особенности WordCraft заключаются в ее легковесности и в том, что она…

REVISE: инструмент для оценки смещений в датасетах с изображениями

26 июля 2020

REVISE: инструмент для оценки смещений в датасетах с изображениями

REVISE — инструмент для оценки смещений в датасетах с изображениями. REVISE позволяет пользователю учесть неравномерность данных и оценить, насколько уместно использовать тот или иной датасет в рамках целевой задачи. Инструмент…

AViD: датасет для распознавания действий на видео

25 июля 2020

AViD: датасет для распознавания действий на видео

AViD — это публичный датасет с анонимизированными видеозаписями из разных стран. Датасет предназначен для задачи распознавания действий. AViD состоит из видео, где человек выполняет одно действие. Разнообразие в датасете обеспечивается…

ANLI: датасет от FAIR для обучения робастных NLP-моделей

4 июля 2020

ANLI: датасет от FAIR для обучения робастных NLP-моделей

ANLI (Adversarial Natural Language Inference) — это датасет от FAIR для обучения более робастных NLP-моделей. Задача natural language inference тестирует модель на то, как хорошо модель понимает язык. Цель заключается…

30 самых крупных датасетов для машинного обучения в TensorFlow

3 июля 2020

30 самых крупных датасетов для машинного обучения в TensorFlow

TensorFlow — это одна из наиболее популярных открытых библиотек с датасетами для задач машинного обучения. Разработкой TensorFlow занимаются исследователи из Google Brain. Библиотека предоставляет доступ к датасетам с изображениями, видео,…

EPIC-Kitchens: датасет с видеозаписями действий от первого лица

29 июня 2020

EPIC-Kitchens: датасет с видеозаписями действий от первого лица

EPIC-Kitchens — это набор видеозаписей, снятых от первого лица, где люди выполняют действия на кухне. Визуальный ряд сопровождается нарративом от актора, в котором озвучивается каждое действие. Всего данные состоят из…

Sequencer: алгоритм ищет зависимости в данных

29 июня 2020

Sequencer: алгоритм ищет зависимости в данных

Sequencer — это алгоритм, который автоматически извлекает основные закономерности в данных. Для этого Sequencer переупорядочивает набор объектов, чтобы получить наиболее длинное многообразие, описывающее сходства объектов. Алгоритм использует четыре разные метрики.…

Hateful Memes: контест по распознаванию оскорбительных мемов от FAIR

23 мая 2020

Hateful Memes: контест по распознаванию оскорбительных мемов от FAIR

Hateful Memes датасет состоит более чем из 10 тысяч примеров оскорбительных мемов. Разработкой датасета занимались исследователи из Facebook AI. FAIR лицензировали изображения из Getty Images, чтобы исследователи могли использовать датасет…

Facebook опубликовали среду для обучения RL-агентов

14 мая 2020

Facebook опубликовали среду для обучения RL-агентов

Facebook опубликовали среду для обучения RL-агентов на основе игры NetHack.  NetHack — это игра в терминале, которая схожа с Minecraft. Среда NetHack Learning Environment (NLE) использует версию 3.6.6 игры. NLE…

SCITLDR: датасет для суммаризации научных статей

7 мая 2020

SCITLDR: датасет для суммаризации научных статей

В AllenAI предложили новую задачу по автоматической генерации кратких выдержек из научных статей. Чтобы облегчить исследования на эту тему, исследователи опубликовали датасет SCITLDR. Датасет содержит 3.9 тысячи выдержки. Для каждой…

Mapillary опубликовали датасет для распознавания мест

6 мая 2020

Mapillary опубликовали датасет для распознавания мест

Mapillary Street-level Sequences Dataset (MSLS) — это самый крупный датасет с изображениями для предсказания мест. Датасет содержит 1.6 миллионов изображений, для каждого из которых доступны метаданные местности. Изображения мест снимали…

StereoSet: датасет для обучения непредвзятых языковых моделей

29 апреля 2020

StereoSet: датасет для обучения непредвзятых языковых моделей

StereoSet — это датасет для тестирования предобученной языковой модели на непредвзятость. Модель тестируется на наличие стереотипов о гендере, профессии, расе и религии. Языковые модели отражают реальность. Они обучаются на корпусах…

Yoga-82: датасет для классификации позы человека на изображении

27 апреля 2020

Yoga-82: датасет для классификации позы человека на изображении

Yoga-82 — это датасет для классификации позы человека на изображении. Данные состоят из изображений с людьми, которые занимаются йогой. Всего в датасете 82 класса, которые отражают позы из йоги. На…

Waymo используют аугментацию данных для обучения беспилотных автомобилей

17 апреля 2020

Waymo используют аугментацию данных для обучения беспилотных автомобилей

Чтобы беспилотный автомобиль безопасно передвигался по дороге, система в автомобиле собирает данные с камер, лидаров и радаров. Ситуации, с которыми автомобиль сталкивается в реальности и в симуляции, используются для обучения…