Objects365: датасет для распознавания объектов

9 ноября 2019

Objects365: датасет для распознавания объектов

Objects365 — это самый крупный размеченный датасет для распознавания объектов. Данные состоят из 638 тысяч изображений, 365 категорий объектов и 10 миллионов размеченных границ объектов. Датасет и предобученные нейросети доступны…

JRDB: датасет для обучения нейросетей визуальному восприятию

8 ноября 2019

JRDB: датасет для обучения нейросетей визуальному восприятию

JRDB — это набор данных с 64 минутами мультимодальных сенсорных данных. Датасет был собран с помощью робота JackRabbot. Данные содержат видео 360 градусов, 3D облака точек, аудиосигналы, сферическую панораму и…

WiderPerson: датасет для распознавания пешеходов

14 октября 2019

WiderPerson: датасет для распознавания пешеходов

WiderPerson — это датасет для распознавания пешеходов на изображениях. Данные состоят из 13,382 изображений и 399,786 разметок. Разметка делится на пять категорий: пешеходы, водители, частично видимые люди, толпа и игнорируемые…

Detectron2: библиотека для распознавания объектов от FAIR

12 октября 2019

Detectron2: библиотека для распознавания объектов от FAIR

FAIR опубликовали Pytorch библиотеку для распознавания объектов Detectron2. В новой версии библиотеки появились модульный дизайн, имплементации state-of-the-art моделей, поддержка обучения моделей на нескольких GPU серверах и функционал для использования модели…

FoodAI: нейросеть распознает калорийность еды по изображению

30 сентября 2019

FoodAI: нейросеть распознает калорийность еды по изображению

В SalesForce обучили нейросеть, которая по изображению еды предсказывает ее калорийность. Модель доступна через API сервис или в приложении Healthy 365. FoodAI обходит существующие подходы на задаче классификации типа блюда.…

CORnet-S: нейросеть моделирует работу мозга при распознавании объектов

20 сентября 2019

CORnet-S: нейросеть моделирует работу мозга при распознавании объектов

CORnet-S — это нейросеть, которая распознает объекты похожим на мозг примата образом.  Архитектура CORnet-S похожа на устройство вентрального визуального потока приматов. Вентральный поток отвечает за распознавание и классификацию наблюдаемого объекта.…

Как использовать нейросеть для диагностирования кожных заболеваний

16 сентября 2019
google2

Как использовать нейросеть для диагностирования кожных заболеваний

В Google обучили нейросеть, которая детектирует кожные заболевания на изображении. По результатам, модель достигает точности сертифицированного дерматолога при определении 26 типов кожных заболеваний. Точность определения кожных заболеваний терапевтами и дерматологами…

CURE-TSD-Real: датасет для проверки системы по распознаванию объектов

13 сентября 2019

CURE-TSD-Real: датасет для проверки системы по распознаванию объектов

CURE-TSD-Real содержит модифицированные изображения дорожных знаков, которые сложно распознать стандартным нейросетям. Дообучение модели на таком наборе данных позволит оценить устойчивость ее предсказаний. Датасет был собран исследователями из Georgia Tech. Исследователи…

Матричные нейросети: новая модель для распознавания объектов

12 сентября 2019

Матричные нейросети: новая модель для распознавания объектов

Матричные сети (xNets) — это нейросетевая архитектура, которая специально адаптирована под задачу распознавания объектов на изображении. xNet учитывает пропорции объектов на изображении. На задаче key-point based распознавания объектов xNet обошла…

Gated-SCNN: новый state-of-the-art в семантической сегментации

28 июля 2019

Gated-SCNN: новый state-of-the-art в семантической сегментации

Gated-SCNN — это двухпоточная сверточная нейросеть для семантической сегментации изображений. GSCNN обходит state-of-the-art архитектуры на 2-4% на задаче Cityscapes. Архитектура была разработана исследователями из NVIDIA. Текущие state-of-the-art методы для сегментации…

Google открыли соревнование по сегментации изображений

14 июля 2019
google brain bert ai

Google открыли соревнование по сегментации изображений

Google запустили второе соревнование по компьютерному зрению на Kaggle — Open Images 2019. Соревнование делится на три трека: распознавание объектов, выявление взаимосвязей между объектами и instance сегментация объектов. Участие можно…

DSNet: нейросеть предсказывает количество людей на изображении

10 июля 2019

DSNet: нейросеть предсказывает количество людей на изображении

DSNet — это end-to-end нейросеть, которая определяет количество людей на снимке. Подход обходит существующие решения на 4-х задачах: ShanghaiTech, UCF-QNRF, UCF CC 50 и UCSD. Результаты экспериментов показывают, что DSNet…

Как делать аугментацию данных для задачи распознавания объектов

29 июня 2019

Как делать аугментацию данных для задачи распознавания объектов

Исследователи из Google Brain разработали метод поиска оптимальной обработки изображений перед обучением модели. Расширение данных с помощью методов аугментации увеличивает точность модели — на 2.3 пункта для COCO и на…

Reasoning-RCNN: нейросеть распознает объекты из тысяч категорий

13 июня 2019

Reasoning-RCNN: нейросеть распознает объекты из тысяч категорий

Reasoning-RCNN детектирует трудно различимые объекты на изображении и работает поверх любого детектора. Reasoning-RCNN улучшает state-of-the-art результаты для нескольких соревнований: на 16% для VisualGenome, на 37% для ADE и на 15%…

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

11 июня 2019

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

3D-BoNet — это нейросетевая модель, которая распознает объекты на 3D изображениях и решает задачу instance сегментации в 10 раз более вычислительно эффективно по сравнению с существующими подходами. Под 3D изображением…

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

8 июня 2019

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

Mesh R-CNN — это нейросетевая архитектура, которая для объектов входного изображения предсказывает их форму. Модель была описана в работе от Facebook AI Research (FAIR). По метрикам Mesh R-CNN обходит существующие…

Нейросеть от Google AI предсказывает, насколько близко объект находится к камере

27 мая 2019

Нейросеть от Google AI предсказывает, насколько близко объект находится к камере

В Google AI обучили нейросеть, которая определяет, насколько объекты на изображении отдалены от камеры. Предложенный подход сравним с state-of-the-art решениями. Это первая нейросеть, обученная для случая, когда и камера, и…

Нейросеть обучена выявлять рак легких по томографическим снимкам

22 мая 2019

Нейросеть обучена выявлять рак легких по томографическим снимкам

Исследователи из Google AI представили нейросетевую модель, которая по томографическим снимкам диагностирует рак легких. Модель использует актуальные результаты томографии пациента и исторические результаты томографии, чтобы делать предсказании о риске рака…

В Оксфорде обучили self-supervised метод для сегментирования объектов на видео

18 мая 2019

В Оксфорде обучили self-supervised метод для сегментирования объектов на видео

Исследователи из Оксфорда представили нейросеть, которая по одному размеченному изображению распространяет разметку на всю видеозапись. На вход нейросети поступает размеченное изображение (часть видеозаписи), цель нейросети сохранить информацию о распознанных объектах…

Google AI расширила датасет для распознавания достопримечательностей

9 мая 2019
Достопримечательности из датасета

Google AI расширила датасет для распознавания достопримечательностей

Google AI выпустила Google-Landmarks-v2, вторую версию крупнейшего датасета для распознавания достопримечательностей , расширив его до 5 миллионов изображений (в 2 раза). Особенностью датасета стало количество достопримечательностей — более 200 тысяч…

Как спрятаться от системы распознавания объектов

3 мая 2019

Как спрятаться от системы распознавания объектов

Студенты из KU Leuven обучили нейросеть, которая помогает скрыться от систем по детектированию объектов. Нейросеть генерирует принты, которые можно наложить поверх объекта, и детектор с меньшей вероятностью распознает объект. Видеодемострация…