ScaNN: метод поиска близких векторов от Google AI

4 августа 2020

ScaNN: метод поиска близких векторов от Google AI

ScaNN — это библиотека для поиска близких векторов. Разработкой библиотеки занимались исследователи Google AI. Описание проблемы Поиск совпадающих строк в базе данных обычно осуществляется с помощью скриптовых языков, как SQL.…

Нейросеть редактирует изображение по текстовому описанию

3 августа 2020

Нейросеть редактирует изображение по текстовому описанию

Исследователи из ETH Zurich разработали нейросеть, которая позволяет контролировать генерируемое изображение с помощью высокоуровневых атрибутов и текстовых описаний. На вход модели можно подать маску сегментации объектов с их классами. Нейросеть…

Нейросеть распознает 3D позу человека в реальном времени

21 июля 2020

Нейросеть распознает 3D позу человека в реальном времени

Оценка позы человека и распознавание действия — это связанные задачи, потому как обе проблемы зависят от представления и анализа тела человека. Тем не менее большинство существующих моделей решают эти проблемы…

Нейросеть от FAIR повышает разрешение изображения в 16 раз

20 июля 2020

Нейросеть от FAIR повышает разрешение изображения в 16 раз

FAIR опубликовали нейросетевую модель, которая повышает разрешение изображения в 16 раз. Нейросеть принимает на вход изображение с разрешением в 960×540. Затем модель апсемплит изображение до разрешения в 3840×2160 в реальном…

Нейросеть генерирует видеозаписи с говорящими головами

20 июля 2020

Нейросеть генерирует видеозаписи с говорящими головами

Исследователи из University of Rochester опубликовали нейросеть, которая генерирует видеозаписи с говорящими людьми на основе аудиозаписи. Предложенная модель генерирует более реалистичные видеозаписи, чем state-of-the-art подходы. При этом в нейросети эксплицитно…

ContraCode: нейросеть находит функционально схожий код

20 июля 2020

ContraCode: нейросеть находит функционально схожий код

ContraCode — это нейросеть для поиска функционально схожего кода программ. Модель предобучали с помощью contrastive pre-training подхода. Предобученную нейросеть затем дообучили на задачах вывода типов и суммаризации кода. Во время…

Нейросеть от NVIDIA генерирует видеозаписи из облаков точек

18 июля 2020

Нейросеть от NVIDIA генерирует видеозаписи из облаков точек

NVIDIA опубликовали нейросетевой подход для генерации видеозаписей. Сцены на сгенерированных видеозаписях консистентны во времени и с разных точек обзора. Предыдущие модели для генерации видео не обеспечивали консистентность сцены. С каждым…

Нейросеть редактирует содержание изображения

17 июля 2020

Нейросеть редактирует содержание изображения

Исследователи из Hebrew University of Jerusalem обучили нейросеть, которая редактирует содержание изображение. Модель принимает на вход оригинальное изображение и карту сегментации отредактированного изображения. На выходе нейросеть выдает отредактированное в соответствии…

Обучение моделей с подкреплением с помощью дуальности

10 июля 2020

Обучение моделей с подкреплением с помощью дуальности

Исследователи из Google AI предлагают новый подход для обучения моделей с подкреплением. Подход позволяет использовать алгоритмы, которые избегают использование грубых аппроксимаций при переходе от математического обоснования к практической реализации. Предложенный…

Нейросеть анимирует взгляд при генерации 3D модели лица

9 июля 2020

Нейросеть анимирует взгляд при генерации 3D модели лица

Исследователи из Facebook Reality Labs предложили подход для более точного трекинга лица и взгляда. Внутри системы встроена нейросеть, которая совместно выучивается генерировать лицо пользователя и его глаза в 3D. Модель…

Нейросеть от Disney Research подменяет лица на изображении

4 июля 2020

Нейросеть от Disney Research подменяет лица на изображении

Disney Research опубликовали нейросетевой алгоритм, для автоматической замены лиц на изображениях и видео. Это первый метод, который способен рендерить фотореалистичные и консистентные по времени изображения в высоком разрешении. Модель обучается…

Transformer языковая модель восстанавливает структуру белка

3 июля 2020

Transformer языковая модель восстанавливает структуру белка

Исследователи из Salesforce обучили языковую модель восстанавливать структуру белка. В качестве архитектуры использовали state-of-the-art языковую модель BERT. Помимо модели, разработчики публикую инструмент для трехмерной визуализации механизма внимания обученной модели.  Модель,…

DeepFaceDrawing: нейросеть генерирует изображения людей по скетчам

3 июля 2020

DeepFaceDrawing: нейросеть генерирует изображения людей по скетчам

DeepFaceDrawing — это нейросетевая модель, которая генерирует изображение человека на основе скетча. Разработкой сети занимались исследователи из University of Hong Kong. Проблема существующих подходов Существующие нейросетевые подходы к генерации изображений…

В Amazon генерируют синтетические групповые снимки

3 июля 2020

В Amazon генерируют синтетические групповые снимки

Исследователи из Amazon опубликовали метод для генерации реалистичных синтетических снимков с группой людей. Такие данные используются при обучении моделей компьютерного зрения, в случае если реальных размеченных данных недостаточно. При этом…

Нейросеть извлекает структурированную информацию из документов

2 июля 2020

Нейросеть извлекает структурированную информацию из документов

Google AI опубликовали нейросеть, которая извлекает структурированную информацию из шаблонных документов. В отличие от предыдущих подходов, модель использует знание о типах целевой информации, чтобы отобрать и проранжировать распознанные части текста…

AFDet: легковесная нейросеть для распознавания объектов в 3D

29 июня 2020

AFDet: легковесная нейросеть для распознавания объектов в 3D

Распознавание объектов в 3D облаке точек на встраиваемых системах активно применяется в робототехнике, включая автономное вождение. Большинство прошлых работ пытаются решить задачу с помощью anchor-based методов распознавания объектов. Однако такие…

HiFiC: нейросеть реалистично сжимает изображения

20 июня 2020

HiFiC: нейросеть реалистично сжимает изображения

Задача сжатия размера изображения с минимальной потерей качества — это одна из актуальных проблем в компьютерном зрении. Для ее решения state-of-the-art подходом является использование GAN. Исследователи из Google Research проэкспериментировали…

Нейросетевая модель от FAIR добавляет человека на фотографию

20 июня 2020

Нейросетевая модель от FAIR добавляет человека на фотографию

В FAIR разработали нейросеть, которая добавляет человека на фотографию. Модель принимает на вход целевое изображение и маску человека, которого необходимо добавить на целевое изображение. На выходе модель отдает модифицированную целевую…

OpenAI обучили GPT-2 дополнять и генерировать изображения

19 июня 2020

OpenAI обучили GPT-2 дополнять и генерировать изображения

Исследователи из OpenAI обучили GPT-2 модель дополнять и генерировать изображения. Обученная iGPT обходит state-of-the-art подходы в задаче классификации изображений. Несмотря на более высокие скоры по сравнению со сверточными моделями, обучение…

Датасет для распознавания текста дорожных знаков с видеозаписи

2 июня 2020

Датасет для распознавания текста дорожных знаков с видеозаписи

RoadText-1K — это датасет для распознавания текста дорожных знаков с видеозаписей. Датасет в 20 раз больше, чем самый крупный существующий датасет для текста в видео. Данные состоят из 1000 видеозаписей,…

Модель от DeepMind детектирует заболевание сетчатки глаза

2 июня 2020
deepmind maths challenge

Модель от DeepMind детектирует заболевание сетчатки глаза

DeepMind совместно с Moorfields Eye Hospital и Google Health обучили нейросеть, которая распознает развитие заболевания сетчатки. Модель обучена детектировать развитие возрастной макулярной дегенерации (AMD) в следующие 6 месяцев. По результатам…