Нейросеть распознает перекрытые объекты на видеозаписи

1 апреля 2020

Нейросеть распознает перекрытые объекты на видеозаписи

Представление о постоянстве объектов (Object Permanence) позволяет людям судить о положении объектов, которые закрыты другими объектами и вне зоны видимости. Это происходит через осознание, что объекты продолжают существовать, даже если…

RL-агент от DeepMind обошел человека во всех 57 играх Atari 2600

1 апреля 2020

RL-агент от DeepMind обошел человека во всех 57 играх Atari 2600

DeepMind разработали RL-агента Agent57, который обошел человека во всех 57 играх Atari 2600. Agent57 совмещает в себе алгоритм для эффективного исследования среды с мета-контроллером. Мета-контроллер отвечает за адаптацию исследования среды…

COVID-Net: нейросеть распознает наличие вируса по снимку груди

1 апреля 2020

COVID-Net: нейросеть распознает наличие вируса по снимку груди

COVID-Net — это глубокая сверточная нейросеть, которая распознает наличие COVID-19 по рентгеновскому снимку груди. Исследователи обучали модель на датасете с 5941 рентгеновскими снимками 2839 пациентов. Для части пациентов из выборки…

RL-агента обучили восстанавливать 3D форму объектов

31 марта 2020

RL-агента обучили восстанавливать 3D форму объектов

Исследователи из University of Hong Kong и Technical University of Munich обучили RL-агента восстанавливать 3D форму объектов. Агент в процессе обучения выучивает политики 3D моделирования. В программах для 3D моделирования,…

DCNAS: автоматический поиск архитектуры сети для сегментации изображений

31 марта 2020

DCNAS: автоматический поиск архитектуры сети для сегментации изображений

Методы нейронного поиска архитектуры (NAS) потенциально могут облегчить разработку архитектуры нейросетей. Однако существующие NAS алгоритмы обычно работают с ограниченным пространством поиска и ищут архитектуру на датасете, который схож с целевым.…

BachGAN: нейросеть генерирует изображения на основе карт расположения объектов

30 марта 2020

BachGAN: нейросеть генерирует изображения на основе карт расположения объектов

BachGAN — это нейросеть, которая генерирует изображения в высоком разрешении на основе карт расположения объектов. Модель принимает на вход схему с целевым расположением объектов. Нейросеть заполняет остаток изображения по схеме.…

Taskmaster-2: датасет с диалогами от Google Research

30 марта 2020

Taskmaster-2: датасет с диалогами от Google Research

Taskmaster-2 — это датасет с 17,289 диалогов на 7 тем: рестораны, заказ еды, кино, отели, полеты, музыка и спорт. Все диалоги в датасете собирали с помощью системы Wizard of Oz…

Генеративная нейросеть меняет время суток на изображении

24 марта 2020

Генеративная нейросеть меняет время суток на изображении

Samsung AI опубликовали нейросетевую модель, которая заменяет освещение на изображении в зависимости от времени суток. Код проекта доступен в открытом репозитории на GitHub. Моделирование времени суток для изображений в высоком…

Transformer нейросеть распознает текст на изображениях

22 марта 2020

Transformer нейросеть распознает текст на изображениях

Transformer-OCR — нейросетевая модель, которую обучили распознавать надписи на изображениях. Модель обходит существующие state-of-the-art методы на 5 датасетах. Для датасета с изображениями вывесок с закрученным текстом CUTE модель обходит предыдущие…

AllenAI опубликовали 10 соревнований по обработке исследований о COVID-19

17 марта 2020

AllenAI опубликовали 10 соревнований по обработке исследований о COVID-19

Исследователи из AllenAI опубликовали на Kaggle датасет с 29 тысячами открытых научных статей о COVID-19. Для COVID-19 Open Research Dataset доступны 10 соревнований в области обработки естественного языка.  Описание датасета…

Как Facebook распознает фейковые профили с помощью нейросетей

16 марта 2020

Как Facebook распознает фейковые профили с помощью нейросетей

За 2019 год Facebook заблокировал 2 миллиарда фейковых аккаунтов. Мошенники используют фейковые аккаунты, чтобы распространять спам, ссылки на фишинговые сайты или малварь.  Компания выложила детали ML-системы, которая классифицировала фейковые профили.…

Нейросеть распознает средства передвижения в 3D по облаку точек

16 марта 2020

Нейросеть распознает средства передвижения в 3D по облаку точек

SegVoxelNet — это нейросеть для распознавания средств передвижения в 3D. Модель принимает на вход облако точек с моделью дороги. На выходе она предсказывает границы объектов. SegVoxelNet обходит state-of-the-art подходы, которые…

DeepRobust: библиотека для состязательных атак на нейросети

16 марта 2020

DeepRobust: библиотека для состязательных атак на нейросети

DeepRobust — это библиотека на PyTorch для проведения состязательных атак на нейросети, которые обрабатывают картинки и графы. В библиотеке доступны методы защиты от состязательных атак. Состязательные атаки на нейросети Нейросети…

BART: state-of-the-art нейросетевая архитектура для суммаризации текстов

16 марта 2020

BART: state-of-the-art нейросетевая архитектура для суммаризации текстов

BART — это state-of-the-art нейросеть для суммаризации текстов. Задача абстрактивной суммаризации текстов предполагает, что модель получает на вход текст. На выходе модель. генерирует текст с описанием общих идей из входного…

HigherHRNet: снизу-вверх подход для оценки позы человека на изображении

16 марта 2020

HigherHRNet: снизу-вверх подход для оценки позы человека на изображении

HigherHRNet — это нейросеть для распознавания позы человека снизу-вверх. Модель решает проблему вариации масштаба людей на изображении. В основе HigherHRNet лежат Feature Pyramid Networks (FPNs). HigherHRNet обходит предыдущие подходы снизу-вверх…

Neural Tangents: библиотека для обучения бесконечно широких нейросетей

15 марта 2020

Neural Tangents: библиотека для обучения бесконечно широких нейросетей

Одним из теоретических трюков, который провоцировал прогресс в глубоком обучении, заключается в том, что увеличение ширины нейросети приводит более стабильному поведению модели. Недавние исследования показали, что потенциально бесконечные в ширине…

В FAIR применили DensePose для распознавания позы шимпанзе

15 марта 2020

В FAIR применили DensePose для распознавания позы шимпанзе

Исследователи из FAIR перенесли существующую модель для распознавания позы человека на шимпанзе. Модель основывается на архитектуре DensePose и R-CNN. Помимо модели, исследователи опубликовали два датасета с размеченными позами шимпанзе.  Описание…

Jiant: библиотека для задач обработки естественного языка от NYU

15 марта 2020

Jiant: библиотека для задач обработки естественного языка от NYU

Jiant — это библиотека на Python для решения задач из области обработки естественного языка. Разработкой библиотеки занимаются исследователи из NYU. Jiant включает в себя модели для multitask и transfer обучения.…

DroneVehicle: датасет для подсчета объектов на изображениях с дрона

15 марта 2020

DroneVehicle: датасет для подсчета объектов на изображениях с дрона

DroneVehicle — это датасет с 15,532 RGB снимками с дронов. Для каждого изображения есть инфракрасный снимок. Разметка объектов доступна и для RGB, и для инфракрасных снимков. В датасете размечены направленные…

Нейросеть распознает действия на видео на основе ограниченного количества размеченных данных

15 марта 2020

Нейросеть распознает действия на видео на основе ограниченного количества размеченных данных

SSTDA — это self-supervised нейросетевая модель, которая распознает действия на видеозаписи. По результатам экспериментов, SSTDA обходит текущие state-of-the-art подходы на трех датасетах: GTEA, 50Salads и Breakfast. При этом модель требует…

Нейросеть от FAIR генерирует 3D фотографию из 2D

15 марта 2020

Нейросеть от FAIR генерирует 3D фотографию из 2D

В Facebook появилась возможность конвертировать свою 2D фотографию в 3D с помощью функционала 3D Photos. Внутри 3D Photos — сверточная нейросеть, которая принимает на вход 2D фото и генерирует карту…