Нейросеть дополняет изображение частью другого изображения

16 сентября 2019

Нейросеть дополняет изображение частью другого изображения

Исследователи модифицировали 4 популярных датасета для задачи гармонизации изображения. Датасеты, которые были использованы: COCO, Adobe5k, Flickr, day2night. Гармонизация изображения — это задача переноса переднего плана одного изображения на другое изображение.…

В Google Lens теперь можно прослушивать текст с изображения

6 сентября 2019

В Google Lens теперь можно прослушивать текст с изображения

В приложении Google Lens теперь есть функция прослушивания и перевода текста с изображения. Система сначала распознает куски текста на изображении, формирует структурированный текст из кусков, переводит текст и озвучивает перевод.…

Нейросеть увеличивает разрешение изображения до 8 раз

2 сентября 2019

Нейросеть увеличивает разрешение изображения до 8 раз

Исследователи из Кореи обучили нейросеть, которая увеличивает разрешение фотографии лица до 8 раз. Метод обходит state-of-the-art решения как по количественным, так и по качественным метрикам на задаче реконструкции лица человека…

PIFu: нейросеть моделирует фигуру человека в 3D

30 августа 2019

PIFu: нейросеть моделирует фигуру человека в 3D

PIFu — это end-to-end алгоритм, который восстанавливает 3D-модель одетого человека из одной фотографии. Метод обходит существующие решения на задаче генерации 3D-модели человека из одного изображения.  Метод восстанавливает 3D-модель человека в…

Нейросеть анализирует видео с камер во время операций

29 августа 2019

Нейросеть анализирует видео с камер во время операций

Kaliber Labs разрабатывают нейросеть, которая интерпретирует видео с камер внутри пациента во время операций. Модель определяет оперируемую область и выдает рекомендации, которые выводятся на монитор в операционной. Kaliber Labs —…

Gated-SCNN: новый state-of-the-art в семантической сегментации

28 июля 2019

Gated-SCNN: новый state-of-the-art в семантической сегментации

Gated-SCNN — это двухпоточная сверточная нейросеть для семантической сегментации изображений. GSCNN обходит state-of-the-art архитектуры на 2-4% на задаче Cityscapes. Архитектура была разработана исследователями из NVIDIA. Текущие state-of-the-art методы для сегментации…

VSCO использует машинное обучение для рекомендации фильтров

28 июля 2019

VSCO использует машинное обучение для рекомендации фильтров

VSCO — одно из наиболее популярных мобильных приложений для обработки фото. Приложение помогает выбирать подходящие фильтры к фотографии с помощью сверточных нейросетей. Разработчики используют машинное обучения для рекомендации пресетов. Пресеты…

ImageNet-A: как снизить точность предсказаний нейросети на 90%

27 июля 2019

ImageNet-A: как снизить точность предсказаний нейросети на 90%

ImageNet-A — это датасет с примерами изображений, которые нейросеть не может классифицировать верно. По результатам, модели предсказывали объекты из датасета с точностью в 3%. В то время как для стандартного…

Как использовать эволюционные алгоритмы для обучения беспилотных автомобилей

27 июля 2019

Как использовать эволюционные алгоритмы для обучения беспилотных автомобилей

Исследователи из DeepMind совместно с Waymo применили алгоритм естественного отбора для подбора параметров модели, распознающей пешеходов на дороге. Использование эволюционного обучения сократило процент ложно распознанных объектов на 24%. Чтобы сделать…

Нейросеть от Facebook размечает спутниковые снимки местности

27 июля 2019

Нейросеть от Facebook размечает спутниковые снимки местности

Исследователи в Facebook AI разработали нейросеть, которая размечает дороги на спутниковых снимках. Map With AI — это инструмент для проверки разметки, которую сделала нейросеть. Модель разметила ранее не размеченные дороги…

CellSignal: соревнование по детекции шума на изображениях клеток

27 июля 2019

CellSignal: соревнование по детекции шума на изображениях клеток

Компания Recursion, которая занимается применением машинного обучения для разработки лекарств, опубликовала датасет RxRx1. RxRx1 содержит в себе 296 гигабайт изображений с микроскопа. Компания запустила соревнование на Kaggle по распознаванию технического…

BigBiGAN: новый state-of-the-art подход в обучении представлений

15 июля 2019

BigBiGAN: новый state-of-the-art подход в обучении представлений

BigBiGAN — это генеративная нейросеть, которую адаптировали к задаче обучения представлений. В основе BigBiGAN лежит BigGAN,  — текущий state-of-the-art для генерации изображений. Модель была разработана исследователями из DeepMind. Состязательные генеративные…

Как различается качество облачных ML-сервисов у Amazon, Google и Microsoft

14 июля 2019

Как различается качество облачных ML-сервисов у Amazon, Google и Microsoft

Исследователи протестировали работу облачных сервисов для компьютерного зрения от Amazon, Google и Microsoft. Эксперименты проходили 11 месяцев на 3-х разных задачах. Результаты показывали нестабильность результатов сервисов между собой и во…

Google открыли соревнование по сегментации изображений

14 июля 2019
google brain bert ai

Google открыли соревнование по сегментации изображений

Google запустили второе соревнование по компьютерному зрению на Kaggle — Open Images 2019. Соревнование делится на три трека: распознавание объектов, выявление взаимосвязей между объектами и instance сегментация объектов. Участие можно…

DSNet: нейросеть предсказывает количество людей на изображении

10 июля 2019

DSNet: нейросеть предсказывает количество людей на изображении

DSNet — это end-to-end нейросеть, которая определяет количество людей на снимке. Подход обходит существующие решения на 4-х задачах: ShanghaiTech, UCF-QNRF, UCF CC 50 и UCSD. Результаты экспериментов показывают, что DSNet…

Нейросеть генерирует видеолекции на основе аудиозаписей

8 июля 2019

Нейросеть генерирует видеолекции на основе аудиозаписей

Исследователи из Udacity разработали нейросеть LumièreNet, которая на основе аудиоклипов синтезирует видеолекции в высоком разрешении. Примеры сгенерированных видеозаписей находятся по ссылкам: первый пример, второй пример. В отличие от предшествующих моделей,…

Обзор методов супер-разрешения изображений для начинающих

5 июля 2019

Обзор методов супер-разрешения изображений для начинающих

Супер-разрешение — это результат восстановления изображения с высоким разрешением (HR) из данного изображения с низким разрешением (LR). В этой статье приведены основные подходы для решения задачи генерации супер-разрешения изображения с…

Human in the Loop: как сократить ресурсы на разметку данных

29 июня 2019

Human in the Loop: как сократить ресурсы на разметку данных

BatchBALD — метод для выбора информативных данных для разметки. Подход основан на теории информации. В открытом доступе лежит реализация алгоритма. Что такое активное обучение Использование глубокого обучения и больших размеченных…

Как делать аугментацию данных для задачи распознавания объектов

29 июня 2019

Как делать аугментацию данных для задачи распознавания объектов

Исследователи из Google Brain разработали метод поиска оптимальной обработки изображений перед обучением модели. Расширение данных с помощью методов аугментации увеличивает точность модели — на 2.3 пункта для COCO и на…

YouTube-8M Segments: датасет с видеозаписями из YouTube

29 июня 2019

YouTube-8M Segments: датасет с видеозаписями из YouTube

YouTube-8M — это датасет с видеозаписями из YouTube, который собрали в Google. В обновленной версии датасета для части видеозаписей разметили содержание видео в динамике. Компания запустила соревнование по анализу видеоданных…

DeepView: нейросеть восстанавливает 3D вид по паре фотографий

27 июня 2019

DeepView: нейросеть восстанавливает 3D вид по паре фотографий

DeepView — это нейросеть, которая по паре входных фотографий восстанавливает вид с фотографии с остальных ракурсов. Результаты работы нейросети можно посмотреть на официальном сайте. Модель получает state-of-the-art результаты на датасетах…