CelebA-Spoof: масштабный датасет для антиспуфинга

5 августа 2020

CelebA-Spoof: масштабный датасет для антиспуфинга

CelebA-Spoof — это датасет для антиспуфинга, который состоит из 625,537 изображений 10,177 людей. Антиспуфинг лица — это методы борьбы с обманом систем по распознаванию лиц. Датасет включает в себя 43…

SipMask: новый state-of-the-art в instance сегментации

4 августа 2020

SipMask: новый state-of-the-art в instance сегментации

SipMask — это одноступенчатая нейросеть для instance сегментации объектов на изображении. Модель обходит предыдущие одноступенчатые state-of-the-art подходы на датасете COCO test-dev. В сравнении с TensorMask, SipMask дает прирост AP в…

COCO-WholeBody: первый датасет для оценки позы всего тела

4 августа 2020

COCO-WholeBody: первый датасет для оценки позы всего тела

COCO-WholeBody — это первый датасет для оценки позы всего тела. COCO-WholeBody является расширением датасета COCO 2017 с теми же разбивками на тренировочную и валидационную выборки, как в COCO. Для каждого…

ScaNN: метод поиска близких векторов от Google AI

4 августа 2020

ScaNN: метод поиска близких векторов от Google AI

ScaNN — это библиотека для поиска близких векторов. Разработкой библиотеки занимались исследователи Google AI. Описание проблемы Поиск совпадающих строк в базе данных обычно осуществляется с помощью скриптовых языков, как SQL.…

WordCraft: среда для тестирования здравого смысла у RL-агентов

4 августа 2020

WordCraft: среда для тестирования здравого смысла у RL-агентов

WordCraft — это среда для тестирования общих знаний о мире у RL-агентов. Среда основывается на видеоигре Little Alchemy 2. Особенности WordCraft заключаются в ее легковесности и в том, что она…

Libra: фреймворк для обучения ML-моделей в несколько строк кода

3 августа 2020

Libra: фреймворк для обучения ML-моделей в несколько строк кода

Libra — это альтернативный фреймворк для обучения ML-моделей. Основным преимуществом фреймворка является простота в использовании для пользователей без технического бэкграунда в сравнении с существующими популярными фреймворками. Процесс обучения модели занимает…

Нейросеть редактирует изображение по текстовому описанию

3 августа 2020

Нейросеть редактирует изображение по текстовому описанию

Исследователи из ETH Zurich разработали нейросеть, которая позволяет контролировать генерируемое изображение с помощью высокоуровневых атрибутов и текстовых описаний. На вход модели можно подать маску сегментации объектов с их классами. Нейросеть…

CFBI: коллаборативная сегментация объектов на видеозаписи

2 августа 2020

CFBI: коллаборативная сегментация объектов на видеозаписи

CFBI — это нейросеть, которая сегментирует объекты на заднем и переднем планах в видеозаписи. Нейросеть обучалась частично с привлечением размеченных данных (semi-supervised). CFBI отличается от предыдущих подходов тем, что модель…

Pantomime: нейросеть анимирует изображение лица

1 августа 2020

Pantomime: нейросеть анимирует изображение лица

Pantomime — это сервис для создания дипфейк-стикеров. Система использует нейросеть для анимации входного изображения с лицом. С помощью Pantomime можно анимировать как лица людей, так и животных. Разработкой сервиса занималась…

MCT: набор инструментов для презентации ML-моделей

30 июля 2020

MCT: набор инструментов для презентации ML-моделей

Model Card Toolkit (MCT) — это набор инструментов для поддержки разработчиков в сборе информации для карточек моделей. Карточка модели описывает ML-модель на разных уровнях, чтобы повысить прозрачность используемых подходов. В…

TransCoder: нейросеть переводит код программы на другой язык

28 июля 2020

TransCoder: нейросеть переводит код программы на другой язык

TransCoder — это нейросеть, которая переводит код программы с одного языка на другой. Модель не нуждается в размеченных параллельных данных для обучения. На данный момент TransCoder успешно переносит функции на…

REVISE: инструмент для оценки смещений в датасетах с изображениями

26 июля 2020

REVISE: инструмент для оценки смещений в датасетах с изображениями

REVISE — инструмент для оценки смещений в датасетах с изображениями. REVISE позволяет пользователю учесть неравномерность данных и оценить, насколько уместно использовать тот или иной датасет в рамках целевой задачи. Инструмент…

AViD: датасет для распознавания действий на видео

25 июля 2020

AViD: датасет для распознавания действий на видео

AViD — это публичный датасет с анонимизированными видеозаписями из разных стран. Датасет предназначен для задачи распознавания действий. AViD состоит из видео, где человек выполняет одно действие. Разнообразие в датасете обеспечивается…

LipSync: веб-приложение от YouTube для соревнований по подпеванию

21 июля 2020

LipSync: веб-приложение от YouTube для соревнований по подпеванию

LipSync — это веб-приложение от YouTube, которое тестирует, как хорошо пользователь подпевает под песню. Система основывается на нейросети, которая распознает движения лица и губ во время подпевания и оценивает их…

Нейросеть распознает 3D позу человека в реальном времени

21 июля 2020

Нейросеть распознает 3D позу человека в реальном времени

Оценка позы человека и распознавание действия — это связанные задачи, потому как обе проблемы зависят от представления и анализа тела человека. Тем не менее большинство существующих моделей решают эти проблемы…

Voila: библиотека для интерактивных виджетов в Jupyter ноутбуке

20 июля 2020

Voila: библиотека для интерактивных виджетов в Jupyter ноутбуке

Voilà — это библиотека для создания интерактивных виджетов в Jupyter ноутбуках. Инструмент превращает Jupyter ноутбук в автономное веб-приложение. В отличие от ноутбуков, сконвертированных в HTML, каждый пользователь, который подключается в…

Нейросеть от FAIR повышает разрешение изображения в 16 раз

20 июля 2020

Нейросеть от FAIR повышает разрешение изображения в 16 раз

FAIR опубликовали нейросетевую модель, которая повышает разрешение изображения в 16 раз. Нейросеть принимает на вход изображение с разрешением в 960×540. Затем модель апсемплит изображение до разрешения в 3840×2160 в реальном…

Нейросеть генерирует видеозаписи с говорящими головами

20 июля 2020

Нейросеть генерирует видеозаписи с говорящими головами

Исследователи из University of Rochester опубликовали нейросеть, которая генерирует видеозаписи с говорящими людьми на основе аудиозаписи. Предложенная модель генерирует более реалистичные видеозаписи, чем state-of-the-art подходы. При этом в нейросети эксплицитно…

ContraCode: нейросеть находит функционально схожий код

20 июля 2020

ContraCode: нейросеть находит функционально схожий код

ContraCode — это нейросеть для поиска функционально схожего кода программ. Модель предобучали с помощью contrastive pre-training подхода. Предобученную нейросеть затем дообучили на задачах вывода типов и суммаризации кода. Во время…

Нейросеть от NVIDIA генерирует видеозаписи из облаков точек

18 июля 2020

Нейросеть от NVIDIA генерирует видеозаписи из облаков точек

NVIDIA опубликовали нейросетевой подход для генерации видеозаписей. Сцены на сгенерированных видеозаписях консистентны во времени и с разных точек обзора. Предыдущие модели для генерации видео не обеспечивали консистентность сцены. С каждым…

Нейросеть редактирует содержание изображения

17 июля 2020

Нейросеть редактирует содержание изображения

Исследователи из Hebrew University of Jerusalem обучили нейросеть, которая редактирует содержание изображение. Модель принимает на вход оригинальное изображение и карту сегментации отредактированного изображения. На выходе нейросеть выдает отредактированное в соответствии…