DroneVehicle: датасет для подсчета объектов на изображениях с дрона

15 марта 2020

DroneVehicle: датасет для подсчета объектов на изображениях с дрона

DroneVehicle — это датасет с 15,532 RGB снимками с дронов. Для каждого изображения есть инфракрасный снимок. Разметка объектов доступна и для RGB, и для инфракрасных снимков. В датасете размечены направленные…

Kornia: библиотека для компьютерного зрения на PyTorch

16 января 2020

Kornia: библиотека для компьютерного зрения на PyTorch

Kornia — это библиотека для компьютерного зрения, написанная на PyTorch. Kornia выступает аналогом стандартной библиотеки для задач компьютерного зрения OpenCV. В отличие от традиционных фреймворков для CV задач, Kornia поддерживает…

BlendMask: нейросеть обходит state-of-the-art на задаче сегментации объектов

8 января 2020

BlendMask: нейросеть обходит state-of-the-art на задаче сегментации объектов

BlendMask — это нейросетевая модель для instance сегментации объектов на изображении. Модель выдает более точные границы объектов, чем Mask R-CNN, на COCO датасете при схожих параметрах обучения. При этом BlendMask…

SketchTransfer: датасет для обучения нейросетей обобщению

31 декабря 2019

SketchTransfer: датасет для обучения нейросетей обобщению

SketchTransfer — это датасет для обучения нейросетей обобщению с помощью transfer learning. Данные состоят из реальных размеченных изображений и не размеченных скетчей. Стандартные state-of-the-art подходы, которые получают точность 95% на…

SynSin: end-to-end генерация сцены на основе одного изображения

25 декабря 2019

SynSin: end-to-end генерация сцены на основе одного изображения

SynSin — это нейросеть, которая принимает на вход изображение сцены и генерирует изображения данной сцены в других ракурсах. Модель предсказывает 3D облако точек, которые проецируется на новые ракурсы с помощью…

Нейросеть дополняет изображение частью другого изображения

16 сентября 2019

Нейросеть дополняет изображение частью другого изображения

Исследователи модифицировали 4 популярных датасета для задачи гармонизации изображения. Датасеты, которые были использованы: COCO, Adobe5k, Flickr, day2night. Гармонизация изображения — это задача переноса переднего плана одного изображения на другое изображение.…

В Google Lens теперь можно прослушивать текст с изображения

6 сентября 2019

В Google Lens теперь можно прослушивать текст с изображения

В приложении Google Lens теперь есть функция прослушивания и перевода текста с изображения. Система сначала распознает куски текста на изображении, формирует структурированный текст из кусков, переводит текст и озвучивает перевод.…

Нейросеть увеличивает разрешение изображения до 8 раз

2 сентября 2019

Нейросеть увеличивает разрешение изображения до 8 раз

Исследователи из Кореи обучили нейросеть, которая увеличивает разрешение фотографии лица до 8 раз. Метод обходит state-of-the-art решения как по количественным, так и по качественным метрикам на задаче реконструкции лица человека…

PIFu: нейросеть моделирует фигуру человека в 3D

30 августа 2019

PIFu: нейросеть моделирует фигуру человека в 3D

PIFu — это end-to-end алгоритм, который восстанавливает 3D-модель одетого человека из одной фотографии. Метод обходит существующие решения на задаче генерации 3D-модели человека из одного изображения.  Метод восстанавливает 3D-модель человека в…

Нейросеть анализирует видео с камер во время операций

29 августа 2019

Нейросеть анализирует видео с камер во время операций

Kaliber Labs разрабатывают нейросеть, которая интерпретирует видео с камер внутри пациента во время операций. Модель определяет оперируемую область и выдает рекомендации, которые выводятся на монитор в операционной. Kaliber Labs —…

Gated-SCNN: новый state-of-the-art в семантической сегментации

28 июля 2019

Gated-SCNN: новый state-of-the-art в семантической сегментации

Gated-SCNN — это двухпоточная сверточная нейросеть для семантической сегментации изображений. GSCNN обходит state-of-the-art архитектуры на 2-4% на задаче Cityscapes. Архитектура была разработана исследователями из NVIDIA. Текущие state-of-the-art методы для сегментации…

VSCO использует машинное обучение для рекомендации фильтров

28 июля 2019

VSCO использует машинное обучение для рекомендации фильтров

VSCO — одно из наиболее популярных мобильных приложений для обработки фото. Приложение помогает выбирать подходящие фильтры к фотографии с помощью сверточных нейросетей. Разработчики используют машинное обучения для рекомендации пресетов. Пресеты…

ImageNet-A: как снизить точность предсказаний нейросети на 90%

27 июля 2019

ImageNet-A: как снизить точность предсказаний нейросети на 90%

ImageNet-A — это датасет с примерами изображений, которые нейросеть не может классифицировать верно. По результатам, модели предсказывали объекты из датасета с точностью в 3%. В то время как для стандартного…

Как использовать эволюционные алгоритмы для обучения беспилотных автомобилей

27 июля 2019

Как использовать эволюционные алгоритмы для обучения беспилотных автомобилей

Исследователи из DeepMind совместно с Waymo применили алгоритм естественного отбора для подбора параметров модели, распознающей пешеходов на дороге. Использование эволюционного обучения сократило процент ложно распознанных объектов на 24%. Чтобы сделать…

Нейросеть от Facebook размечает спутниковые снимки местности

27 июля 2019

Нейросеть от Facebook размечает спутниковые снимки местности

Исследователи в Facebook AI разработали нейросеть, которая размечает дороги на спутниковых снимках. Map With AI — это инструмент для проверки разметки, которую сделала нейросеть. Модель разметила ранее не размеченные дороги…

CellSignal: соревнование по детекции шума на изображениях клеток

27 июля 2019

CellSignal: соревнование по детекции шума на изображениях клеток

Компания Recursion, которая занимается применением машинного обучения для разработки лекарств, опубликовала датасет RxRx1. RxRx1 содержит в себе 296 гигабайт изображений с микроскопа. Компания запустила соревнование на Kaggle по распознаванию технического…

BigBiGAN: новый state-of-the-art подход в обучении представлений

15 июля 2019

BigBiGAN: новый state-of-the-art подход в обучении представлений

BigBiGAN — это генеративная нейросеть, которую адаптировали к задаче обучения представлений. В основе BigBiGAN лежит BigGAN,  — текущий state-of-the-art для генерации изображений. Модель была разработана исследователями из DeepMind. Состязательные генеративные…

Как различается качество облачных ML-сервисов у Amazon, Google и Microsoft

14 июля 2019

Как различается качество облачных ML-сервисов у Amazon, Google и Microsoft

Исследователи протестировали работу облачных сервисов для компьютерного зрения от Amazon, Google и Microsoft. Эксперименты проходили 11 месяцев на 3-х разных задачах. Результаты показывали нестабильность результатов сервисов между собой и во…

Google открыли соревнование по сегментации изображений

14 июля 2019
google brain bert ai

Google открыли соревнование по сегментации изображений

Google запустили второе соревнование по компьютерному зрению на Kaggle — Open Images 2019. Соревнование делится на три трека: распознавание объектов, выявление взаимосвязей между объектами и instance сегментация объектов. Участие можно…

DSNet: нейросеть предсказывает количество людей на изображении

10 июля 2019

DSNet: нейросеть предсказывает количество людей на изображении

DSNet — это end-to-end нейросеть, которая определяет количество людей на снимке. Подход обходит существующие решения на 4-х задачах: ShanghaiTech, UCF-QNRF, UCF CC 50 и UCSD. Результаты экспериментов показывают, что DSNet…

Нейросеть генерирует видеолекции на основе аудиозаписей

8 июля 2019

Нейросеть генерирует видеолекции на основе аудиозаписей

Исследователи из Udacity разработали нейросеть LumièreNet, которая на основе аудиоклипов синтезирует видеолекции в высоком разрешении. Примеры сгенерированных видеозаписей находятся по ссылкам: первый пример, второй пример. В отличие от предшествующих моделей,…