ResNet (34, 50, 101): «остаточные» CNN для классификации изображений

29 января 2019
resnet-neural-network

ResNet (34, 50, 101): «остаточные» CNN для классификации изображений

ResNet — это сокращенное название для Residual Network (дословно  — «остаточная сеть»), но что такое residual learning («остаточное обучение»)? Глубокие сверточные нейронные сети превзошли человеческий уровень классификации изображений в 2015…

Градиентый бустинг — просто о сложном

27 ноября 2018
градиентный бустинг

Градиентый бустинг — просто о сложном

Хотя большинство победителей соревнований на Kaggle используют композицию разных моделей, одна из них заслуживает особого внимания, так как является почти обязательной частью. Речь, конечно, про Градиентный бустинг (GBM) и его…

FaceNet — пример простой системы распознавания лиц с открытым кодом Github

16 ноября 2018

FaceNet — пример простой системы распознавания лиц с открытым кодом Github

Распознавание лица — последний тренд в авторизации пользователя. Apple использует Face ID, OnePlus — технологию Face Unlock. Baidu использует распознавание лица вместо ID-карт для обеспечения доступа в офис, а при…

Восстановление 3D-модели волос и головы из видео

6 ноября 2018

Восстановление 3D-модели волос и головы из видео

Трехмерные модели волос используются в виртуальной и дополненной реальности, видеоиграх, медицинском ПО. Однако создать реалистичную 3D-модель прически трудно даже в контролируемой среде. Исследователи предложили метод решения ещё более сложной задачи…

Реконструкция 3D-модели головы по нескольким фотографиям

18 октября 2018
3D моделирование головы

Реконструкция 3D-модели головы по нескольким фотографиям

Алгоритмы, которые восстанавливают 3D-модели головы из плоских изображений, должны учитывать позу, освещение, эмоции, гладкие поверхности лиц, ушей, шеи и, наконец, волос. Сейчас качественная реконструкция возможна в том случае, если входные…

Как обмануть алгорим распознавания лиц: быстрая генерация состязательных данных

15 октября 2018
состязательные атаки распознаание лиц

Как обмануть алгорим распознавания лиц: быстрая генерация состязательных данных

Глубокое обучение стремительно развивается и показывает великолепные результаты в широком спектре задач. Методы глубокого обучения используется во многих приложениях, где важна безопасность. Однако, несмотря на замечательные результаты, зачастую превосходящие человеческие…

Линейная регрессия в машинном обучении

10 октября 2018
линейная регрессия

Линейная регрессия в машинном обучении

Линейная регрессия (Linear regression) — модель зависимости переменной x от одной или нескольких других переменных (факторов, регрессоров, независимых переменных) с линейной функцией зависимости. Линейная регрессия относится к задаче определения «линии наилучшего соответствия» через набор точек данных и…

Тепловые карты компонент помогают восстановить лица на фотографиях с низким разрешением

8 октября 2018
face-resolution-upscaling-facial-component-heatmap

Тепловые карты компонент помогают восстановить лица на фотографиях с низким разрешением

Результаты многих техник анализа лица полагаются на соответствующее разрешение изображения. Например, распознавание лица не будет работать корректно, если разрешение лица на фотографии низкое. Что такое Super-Resolution Face super-resolution (FSR) или…

Обучение нейронных сетей: проклятие размерности

3 октября 2018
обучение нейронной сети - проклятие размерности

Обучение нейронных сетей: проклятие размерности

Представьте, что вы альпинист на вершине горы и наступает ночь. Вам нужно добраться до лагеря, что внизу скалы, но в свете тусклого фонарика вы можете видеть лишь на несколько метров.…

AlphaGAN — оценка прозрачности изображений с помощью генеративной нейросети

24 сентября 2018
alphagan матирование

AlphaGAN — оценка прозрачности изображений с помощью генеративной нейросети

Многие приложения предназначенные для редактирования изображения или пост-продакшена фильмов опираются на естественное матирование изображений, как один из шагов обработки. Задача алгоритма матирования состоит в точной оценке прозрачности объекта переднего плана,…

TensorFlow туториал. Часть 1: тензоры и векторы

20 сентября 2018
Tensorflow tutorial

TensorFlow туториал. Часть 1: тензоры и векторы

TensorFlow — это ML-framework от Google, который предназначен для проектирования, создания и изучения моделей глубокого обучения. Глубокое обучение — это область машинного обучения, алгоритмы в которой были вдохновлены структурой и…

Как стирается граница между цифровой камерой и лидаром

14 сентября 2018
lidar

Как стирается граница между цифровой камерой и лидаром

Когда Ouster начали разрабатывать свой лидар три года назад, было очевидно, что исследования в сфере глубокого обучения для камер превзошли исследования по лидарам. Данные лидара обладают невероятными преимуществами: богатая пространственная…

Vid2Vid — GAN для подмены деталей и свойств видеопотока

3 сентября 2018
vid2vid-video-to-video-synthesis-e1535641547242

Vid2Vid — GAN для подмены деталей и свойств видеопотока

Исследователи из NVIDIA и лаборатории Computer Science & AI из MIT представили новый метод синтеза video-to-video, который показывает впечатляющие результаты. Предложенный метод — Vid2Vid — позволяет синтезировать высококачественные, фотореалистичные, плавные…

«Танцуют все!» — невероятное качество Motion Transfer для видео

30 августа 2018
everybody dance now

«Танцуют все!» — невероятное качество Motion Transfer для видео

Плохо умеете танцевать? Больше не проблема! Удивите своих друзей ошеломляющим видео, где вы танцуете, как суперзвезда. Исследователи из Беркли предложили новый способ motion trasfer для видео. Они утверждают, что способны перенести исполнение…

DeepWrinkles — нейросеть для создания детальных 3D-моделей одежды

28 августа 2018

DeepWrinkles — нейросеть для создания детальных 3D-моделей одежды

Facebook AI Research представляет новый подход под названием «DeepWrinkles» для создания реалистичной деформации одежды. Реалистичное моделирование одежды, как известно, представляет собой сложную задачу, и трудно недооценить её значимость в AR/VR,…

Сегментация людей на фотографии в сложных условиях

23 августа 2018

Сегментация людей на фотографии в сложных условиях

Понимание сцены — один из святых граалей сomputer vision. Проводится множество исследований, чтобы достичь абсолютного понимания того, что происходит на картинке. Получение любой дополнительной информации из изображения позволяет продвинуться по…

Анатомически верная анимация из одного изображения

20 августа 2018
GAN анимация

Анатомически верная анимация из одного изображения

Пусть у вас есть фото Хью Джекмана для рекламы. Хью выглядит прекрасно, но клиент хочет чтобы он был повеселее. Нет, вам не нужно звать Хью для еще одной фотографии и…