BachGAN: нейросеть генерирует изображения на основе карт расположения объектов

30 марта 2020

BachGAN: нейросеть генерирует изображения на основе карт расположения объектов

BachGAN — это нейросеть, которая генерирует изображения в высоком разрешении на основе карт расположения объектов. Модель принимает на вход схему с целевым расположением объектов. Нейросеть заполняет остаток изображения по схеме.…

Taskmaster-2: датасет с диалогами от Google Research

30 марта 2020

Taskmaster-2: датасет с диалогами от Google Research

Taskmaster-2 — это датасет с 17,289 диалогов на 7 тем: рестораны, заказ еды, кино, отели, полеты, музыка и спорт. Все диалоги в датасете собирали с помощью системы Wizard of Oz…

Генеративная нейросеть меняет время суток на изображении

24 марта 2020

Генеративная нейросеть меняет время суток на изображении

Samsung AI опубликовали нейросетевую модель, которая заменяет освещение на изображении в зависимости от времени суток. Код проекта доступен в открытом репозитории на GitHub. Моделирование времени суток для изображений в высоком…

Transformer нейросеть распознает текст на изображениях

22 марта 2020

Transformer нейросеть распознает текст на изображениях

Transformer-OCR — нейросетевая модель, которую обучили распознавать надписи на изображениях. Модель обходит существующие state-of-the-art методы на 5 датасетах. Для датасета с изображениями вывесок с закрученным текстом CUTE модель обходит предыдущие…

AllenAI опубликовали 10 соревнований по обработке исследований о COVID-19

17 марта 2020

AllenAI опубликовали 10 соревнований по обработке исследований о COVID-19

Исследователи из AllenAI опубликовали на Kaggle датасет с 29 тысячами открытых научных статей о COVID-19. Для COVID-19 Open Research Dataset доступны 10 соревнований в области обработки естественного языка.  Описание датасета…

Как Facebook распознает фейковые профили с помощью нейросетей

16 марта 2020

Как Facebook распознает фейковые профили с помощью нейросетей

За 2019 год Facebook заблокировал 2 миллиарда фейковых аккаунтов. Мошенники используют фейковые аккаунты, чтобы распространять спам, ссылки на фишинговые сайты или малварь.  Компания выложила детали ML-системы, которая классифицировала фейковые профили.…

Нейросеть распознает средства передвижения в 3D по облаку точек

16 марта 2020

Нейросеть распознает средства передвижения в 3D по облаку точек

SegVoxelNet — это нейросеть для распознавания средств передвижения в 3D. Модель принимает на вход облако точек с моделью дороги. На выходе она предсказывает границы объектов. SegVoxelNet обходит state-of-the-art подходы, которые…

DeepRobust: библиотека для состязательных атак на нейросети

16 марта 2020

DeepRobust: библиотека для состязательных атак на нейросети

DeepRobust — это библиотека на PyTorch для проведения состязательных атак на нейросети, которые обрабатывают картинки и графы. В библиотеке доступны методы защиты от состязательных атак. Состязательные атаки на нейросети Нейросети…

BART: state-of-the-art нейросетевая архитектура для суммаризации текстов

16 марта 2020

BART: state-of-the-art нейросетевая архитектура для суммаризации текстов

BART — это state-of-the-art нейросеть для суммаризации текстов. Задача абстрактивной суммаризации текстов предполагает, что модель получает на вход текст. На выходе модель. генерирует текст с описанием общих идей из входного…

HigherHRNet: снизу-вверх подход для оценки позы человека на изображении

16 марта 2020

HigherHRNet: снизу-вверх подход для оценки позы человека на изображении

HigherHRNet — это нейросеть для распознавания позы человека снизу-вверх. Модель решает проблему вариации масштаба людей на изображении. В основе HigherHRNet лежат Feature Pyramid Networks (FPNs). HigherHRNet обходит предыдущие подходы снизу-вверх…

Neural Tangents: библиотека для обучения бесконечно широких нейросетей

15 марта 2020

Neural Tangents: библиотека для обучения бесконечно широких нейросетей

Одним из теоретических трюков, который провоцировал прогресс в глубоком обучении, заключается в том, что увеличение ширины нейросети приводит более стабильному поведению модели. Недавние исследования показали, что потенциально бесконечные в ширине…

В FAIR применили DensePose для распознавания позы шимпанзе

15 марта 2020

В FAIR применили DensePose для распознавания позы шимпанзе

Исследователи из FAIR перенесли существующую модель для распознавания позы человека на шимпанзе. Модель основывается на архитектуре DensePose и R-CNN. Помимо модели, исследователи опубликовали два датасета с размеченными позами шимпанзе.  Описание…

Jiant: библиотека для задач обработки естественного языка от NYU

15 марта 2020

Jiant: библиотека для задач обработки естественного языка от NYU

Jiant — это библиотека на Python для решения задач из области обработки естественного языка. Разработкой библиотеки занимаются исследователи из NYU. Jiant включает в себя модели для multitask и transfer обучения.…

DroneVehicle: датасет для подсчета объектов на изображениях с дрона

15 марта 2020

DroneVehicle: датасет для подсчета объектов на изображениях с дрона

DroneVehicle — это датасет с 15,532 RGB снимками с дронов. Для каждого изображения есть инфракрасный снимок. Разметка объектов доступна и для RGB, и для инфракрасных снимков. В датасете размечены направленные…

Нейросеть распознает действия на видео на основе ограниченного количества размеченных данных

15 марта 2020

Нейросеть распознает действия на видео на основе ограниченного количества размеченных данных

SSTDA — это self-supervised нейросетевая модель, которая распознает действия на видеозаписи. По результатам экспериментов, SSTDA обходит текущие state-of-the-art подходы на трех датасетах: GTEA, 50Salads и Breakfast. При этом модель требует…

Нейросеть от FAIR генерирует 3D фотографию из 2D

15 марта 2020

Нейросеть от FAIR генерирует 3D фотографию из 2D

В Facebook появилась возможность конвертировать свою 2D фотографию в 3D с помощью функционала 3D Photos. Внутри 3D Photos — сверточная нейросеть, которая принимает на вход 2D фото и генерирует карту…

IG-GAN: нейросеть от Microsoft генерирует 3D объекты по изображению

9 марта 2020

IG-GAN: нейросеть от Microsoft генерирует 3D объекты по изображению

IG-GAN — это нейросеть, которая генерирует 3D модель объекта из 2D изображения. Нейросеть использует готовый рендерер во время обучения. Это позволяет генерировать более реалистичные модели объектов. Исследователи протестировали нейросеть на…

Lexikon: внутренняя система рекомендации датасетов в Spotify

3 марта 2020

Lexikon: внутренняя система рекомендации датасетов в Spotify

Lexikon — это внутренняя рекомендательная система датасетов в Spotify. Цель Lexikon заключается в том, чтобы облегчить поиск данных для сотрудников, которые занимаются анализом данных. Мотивация для создания Lexikon В 2016…

Adversarial Deepfakes: реалистичные дипфейки для оценки детекторов дипфейков

3 марта 2020

Adversarial Deepfakes: реалистичные дипфейки для оценки детекторов дипфейков

Adversarial Deepfakes — это набор состязательных примеров для классификаторов, которые распознают фейковые видео. Данные были сгенерированы на основе датасета FaceForensics++. Дипфейки — это сгенерированные видеозаписи говорящих людей. Такие фейковые видео…

FlyingSquid: библиотека для автоматической разметки данных

3 марта 2020

FlyingSquid: библиотека для автоматической разметки данных

FlyingSquid — это фреймворк для автоматической разметки данных из множества шумных источников разметки. Пользователи пишут простые функции, которые генерируют шумные лейблы для данных. FlyingSquid использует пересечения и разногласия между ними,…

3D-MiniNet: семантическая сегментация облаков точек с помощью нейросети

2 марта 2020

3D-MiniNet: семантическая сегментация облаков точек с помощью нейросети

3D-MiniNet — это нейросеть, которая семантически сегментирует точки в облаке точек, которое было получено с помощью лидара. Модель принимает на вход 3D облако точек сцены и для каждой точки предсказывает…