Neural Voice Puppetry: нейросеть генерирует видеозапись по записи речи

14 декабря 2019
нейросеть генерирует видео по записи речи

Neural Voice Puppetry: нейросеть генерирует видеозапись по записи речи

Neural Voice Puppetry — это нейросеть для генерации видеозаписи говорящего человека по аудиозаписи речи. На вход модель получает аудиозапись целевой персоны или запись голоса виртуального ассистента. Задача модели в том,…

Датасеты для отслеживания объектов на видео

16 ноября 2018

Датасеты для отслеживания объектов на видео

Глубокое обучение лежит в основе работы современных трекеров объектов в видеопотоке. Однако до сих пор существует недостаток больших датасетов для обучения алгоритмов отслеживания. Известные наборы данных (например, VOT и OTB) относительно…

«Танцуют все!» — невероятное качество Motion Transfer для видео

30 августа 2018
everybody dance now

«Танцуют все!» — невероятное качество Motion Transfer для видео

Плохо умеете танцевать? Больше не проблема! Удивите своих друзей ошеломляющим видео, где вы танцуете, как суперзвезда. Исследователи из Беркли предложили новый способ motion trasfer для видео. Они утверждают, что способны перенести исполнение…

Туториал Nvidia для разработчиков: оптимизация RNN с помощью TensorRT

22 августа 2018
tensorrt tutorial

Туториал Nvidia для разработчиков: оптимизация RNN с помощью TensorRT

Видео демонстрирует, как настроить простую рекуррентную нейронную сеть (RNN) на основе языковой модели на уровне символов. Хотя этот образец построен с использованием C ++, вы можете реализовать его на Python…

Видео: как писать научные статьи на тему Computer vision

15 августа 2018
как писать статьи computer vision

Видео: как писать научные статьи на тему Computer vision

Рассказывает Виктор Лемпицки из Оксфордского университета: какие пункты обязательны в статье на тему Computer Vision, на что обращают внимание рецензенты при оценке статьи, и что нужно сделать, чтобы повысить шансы…

ReCoNet: быстрый, точный и когерентный по времени перенос стиля на видео

2 августа 2018
Качественное сравнение с другими методами стилизации

ReCoNet: быстрый, точный и когерентный по времени перенос стиля на видео

По всему миру разработчики используют сверточные нейронные сети для переноса стилистики одного изображения на другое или просто модификации изображения. Когда существующие методы достигли высокой скорости обработки, исследователей и разработчиков заинтересовало…

Сегментация объектов на видео в реальном времени с помощью Pixel-Wise обучения

12 июня 2018
Blazingly Fast Video Object Segmentation with Pixel-Wise Metric Learning

Сегментация объектов на видео в реальном времени с помощью Pixel-Wise обучения

Видео остается одним из самых информационно емких источников данных, но при этом одним из самых дорогих в обработке. Для разработчиков любых приложений важна скорость, глубина и точность обработки данных. Задача выделения…

Нейросеть вырезает GIF-ку из случайного видео с учетом предпочтений пользователя

10 мая 2018
Automatic Creation of Personalized GIFs22

Нейросеть вырезает GIF-ку из случайного видео с учетом предпочтений пользователя

Предположим, вы посмотрели 10-минутное видео, но вас заинтересовала только маленькая часть. Если вы захотите сделать 5-секундную GIF из этого видео, то обработка окажется непростой задачей. Можно ли создать алгоритм для автоматического…