Gated-SCNN: новый state-of-the-art в семантической сегментации

28 июля 2019

Gated-SCNN: новый state-of-the-art в семантической сегментации

Gated-SCNN — это двухпоточная сверточная нейросеть для семантической сегментации изображений. GSCNN обходит state-of-the-art архитектуры на 2-4% на задаче Cityscapes. Архитектура была разработана исследователями из NVIDIA. Текущие state-of-the-art методы для сегментации…

Google открыли соревнование по сегментации изображений

14 июля 2019
google brain bert ai

Google открыли соревнование по сегментации изображений

Google запустили второе соревнование по компьютерному зрению на Kaggle — Open Images 2019. Соревнование делится на три трека: распознавание объектов, выявление взаимосвязей между объектами и instance сегментация объектов. Участие можно…

DSNet: нейросеть предсказывает количество людей на изображении

10 июля 2019

DSNet: нейросеть предсказывает количество людей на изображении

DSNet — это end-to-end нейросеть, которая определяет количество людей на снимке. Подход обходит существующие решения на 4-х задачах: ShanghaiTech, UCF-QNRF, UCF CC 50 и UCSD. Результаты экспериментов показывают, что DSNet…

Как делать аугментацию данных для задачи распознавания объектов

29 июня 2019

Как делать аугментацию данных для задачи распознавания объектов

Исследователи из Google Brain разработали метод поиска оптимальной обработки изображений перед обучением модели. Расширение данных с помощью методов аугментации увеличивает точность модели — на 2.3 пункта для COCO и на…

Reasoning-RCNN: нейросеть распознает объекты из тысяч категорий

13 июня 2019

Reasoning-RCNN: нейросеть распознает объекты из тысяч категорий

Reasoning-RCNN детектирует трудно различимые объекты на изображении и работает поверх любого детектора. Reasoning-RCNN улучшает state-of-the-art результаты для нескольких соревнований: на 16% для VisualGenome, на 37% для ADE и на 15%…

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

11 июня 2019

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

3D-BoNet — это нейросетевая модель, которая распознает объекты на 3D изображениях и решает задачу instance сегментации в 10 раз более вычислительно эффективно по сравнению с существующими подходами. Под 3D изображением…

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

8 июня 2019

Mesh R-CNN: нейросеть, которая моделирует 3D форму объектов

Mesh R-CNN — это нейросетевая архитектура, которая для объектов входного изображения предсказывает их форму. Модель была описана в работе от Facebook AI Research (FAIR). По метрикам Mesh R-CNN обходит существующие…

Нейросеть от Google AI предсказывает, насколько близко объект находится к камере

27 мая 2019

Нейросеть от Google AI предсказывает, насколько близко объект находится к камере

В Google AI обучили нейросеть, которая определяет, насколько объекты на изображении отдалены от камеры. Предложенный подход сравним с state-of-the-art решениями. Это первая нейросеть, обученная для случая, когда и камера, и…

Нейросеть обучена выявлять рак легких по томографическим снимкам

22 мая 2019

Нейросеть обучена выявлять рак легких по томографическим снимкам

Исследователи из Google AI представили нейросетевую модель, которая по томографическим снимкам диагностирует рак легких. Модель использует актуальные результаты томографии пациента и исторические результаты томографии, чтобы делать предсказании о риске рака…

В Оксфорде обучили self-supervised метод для сегментирования объектов на видео

18 мая 2019

В Оксфорде обучили self-supervised метод для сегментирования объектов на видео

Исследователи из Оксфорда представили нейросеть, которая по одному размеченному изображению распространяет разметку на всю видеозапись. На вход нейросети поступает размеченное изображение (часть видеозаписи), цель нейросети сохранить информацию о распознанных объектах…

Google AI расширила датасет для распознавания достопримечательностей

9 мая 2019
Достопримечательности из датасета

Google AI расширила датасет для распознавания достопримечательностей

Google AI выпустила Google-Landmarks-v2, вторую версию крупнейшего датасета для распознавания достопримечательностей , расширив его до 5 миллионов изображений (в 2 раза). Особенностью датасета стало количество достопримечательностей — более 200 тысяч…

Как спрятаться от системы распознавания объектов

3 мая 2019

Как спрятаться от системы распознавания объектов

Студенты из KU Leuven обучили нейросеть, которая помогает скрыться от систем по детектированию объектов. Нейросеть генерирует принты, которые можно наложить поверх объекта, и детектор с меньшей вероятностью распознает объект. Видеодемострация…

Нейросеть диагностирует депрессию по комплексу внешних факторов

25 апреля 2019
нейросеть депрессия

Нейросеть диагностирует депрессию по комплексу внешних факторов

Депрессия является серьёзным заболеванием, от которого страдает большое количество людей в мире. Исследователи из Индийского технологического института Патна и Университета Кана в Нормандии представили глубокую нейронную сеть, которая может быть…

Пирамидальная сеть от FAIR показала state-of-the-art результаты в сегментации изображений

25 апреля 2019
segmentation

Пирамидальная сеть от FAIR показала state-of-the-art результаты в сегментации изображений

Исследователи из Facebook AI Research представили нейросеть Panoptic FPN для сегментации объектов на изображении, которая обходит конкурирующие модели в эффективности. Panoptic FPN показала state-of-the-art результаты в задачах как семантической, так…

Нейросеть NS-CL интерпретирует сцену, требуя всего 5000 изображений для обучения

9 апреля 2019
NS-CL

Нейросеть NS-CL интерпретирует сцену, требуя всего 5000 изображений для обучения

Гибридная модель NS-CL (Neuro-Symbolic Concept Learner) от MIT и Deepmind отвечает на вопросы по типу «Имеет ли красный объект слева такую же форму, как и фиолетовый справа». Модель имеет высокую…

TossingBot от Google учится точно бросать произвольные предметы

3 апреля 2019

TossingBot от Google учится точно бросать произвольные предметы

В Google разработали роборуку TossingBot, способную захватывать и бросать произвольные предметы в ящики, расположенные за пределами ее максимального диапазона досягаемости. Система может совершать более 500 захватов и бросков в час (или…

Hotels-50K: датасет с миллионом фотографий номеров отелей

7 февраля 2019

Hotels-50K: датасет с миллионом фотографий номеров отелей

Датасет Hotels-50K содержит миллион изображений из 50 000 отелей в разных странах. Датасет c номерами отелей создан с целью сопоставлять фотографии со снимками жертв human traffic (торговли людьми) из незаконной онлайн-рекламы,…

Бесплатные карты для автономного транспорта уже покрывают 6 миллионов км дорог

24 января 2019

Бесплатные карты для автономного транспорта уже покрывают 6 миллионов км дорог

Mapillary — открытая платформа, которая собирает фотографии улиц, сделанные людьми с помощью смартфонов. Сервис разработан одноименным шведским стартапом и нацелен на создание постоянно обновляющихся карт для беспилотного транспорта, в которых…

В США создали «виртуальную стену». Она сможет ловить людей на границе с Мексикой

17 января 2019

В США создали «виртуальную стену». Она сможет ловить людей на границе с Мексикой

Компания соучредителя Oculus Палмера Лаки — Anduril Industries — создала технологию видеонаблюдения с алгоритмами распознавания, которая была успешно протестирована военными. Лаки предлагает использовать ее в качестве «виртуальной стены» на границе южной…

Холодильник Samsung Family Hub будет распознавать продукты и предлагать рецепты

14 января 2019
Bixby Vision распознает продукты в холодильнике

Холодильник Samsung Family Hub будет распознавать продукты и предлагать рецепты

На выставке CES 2019 Samsung представил холодильник Family Hub с сенсорным экраном и встроенными камерами, которые передают изображение содержимого на смартфон через приложение Samsung SmartThings. Распознавание продуктов Компания сообщила, что…

Корзина для покупок Caper AI распознает продукты и взимает оплату

11 января 2019

Корзина для покупок Caper AI распознает продукты и взимает оплату

Разработчики Нью-Йоркского стартапа Caper Labs встроили сканер и платежный терминал в корзину для покупок. Сейчас сканер работает как традиционный считыватель штрих-кодов, но компания планирует в сделать процесс более плавным с помощью…