В University of California робота обучили манипулировать тканью

5 марта 2021

В University of California робота обучили манипулировать тканью

Исследователи из University of California и Honda Research Institute обучили робота складывать ткань. Алгоритм основывается на фреймворке для обучения визуальной динамики объектов на основе RGB изображений, — Visual Foresight. Такие…

MLS: мультилингвальный датасет для распознавания речи от FAIR

4 марта 2021

MLS: мультилингвальный датасет для распознавания речи от FAIR

Facebook AI опубликовали мультилингвальный датасет для обучения моделей распознавания речи. Multilingual LibriSpeech (MLS) содержит 50 тысяч часов аудио с речью людей на 8 языках: английском, немецком, испанском, итальянском, португальском и…

Нейросеть от Google AI симулирует движение камеры

3 марта 2021

Нейросеть от Google AI симулирует движение камеры

Нейросеть от Google AI симулирует движение камеры и параллакс для фотографий. Систему Cinematic photos используют в приложении Google Photos. Оценка глубины изображения Наряду с такими последними функциями для фотографии, как…

GraphGallery: библиотека для графовых нейросетей на PyTorch и TensorFlow

2 марта 2021

GraphGallery: библиотека для графовых нейросетей на PyTorch и TensorFlow

GraphGallery — это библиотека для обучения и тестирований графовых нейросетей. В GraphGallery реализованы состязательные атаки на графовые нейросети. Библиотека совместима с PyTorch, TensorFlow 2.x, Pytorch Geometric (PyG) и Deep Graph Library (DGL).…

CSTR: нейросеть распознает текст на изображениях сцены

1 марта 2021

CSTR: нейросеть распознает текст на изображениях сцены

CSTR — это сверточная нейросеть, которая распознает текст на изображениях сцены. Превалирующая часть предыдущих работ рассматривает задачу распознавания текста на изображении сцены как задачу сегментации и seq2seq. Предложенная модель решает…

TransGAN: две Transformer модели как одна GAN

26 февраля 2021

TransGAN: две Transformer модели как одна GAN

TransGAN — GAN-модель, в которой генератор и дискриминатор состоят из двух Transformer-архитектур. Традиционно в GAN архитектуре используются свертки. В TransGAN свертки заменили на Transformer. Код проекта доступен в открытом репозитории…

Google открыли фреймворк для автоматического поиска архитектуры ML-моделей

23 февраля 2021

Google открыли фреймворк для автоматического поиска архитектуры ML-моделей

Model search (MS) — это библиотека, которая использует алгоритмы автоматического поиска архитектуры ML-моделей. Разработчики заявляют, что фреймворк масштабируется на кейсы, когда пространство поиска является немалым. Фреймворк базируется на байесовской оптимизации.…

Twitter открыли архив твитов для научных исследователей

20 февраля 2021

Twitter открыли архив твитов для научных исследователей

Twitter открыли архив твитов для научных исследователей. Так компания поддерживает исследования онлайн-дискурса и трендов на платформе. Подробнее данные и доступ к ним Twitter запустили новый тип подключения к их API,…

DAF:re: публичный датасет для распознавания аниме персонажей

20 февраля 2021

DAF:re: публичный датасет для распознавания аниме персонажей

DAF:re — это публичный датасет для распознавания аниме персонажей. Датасет состоит из 500 тысяч изображений с 3000 классов объектов. Данные по классам распределены неравномерно. Кроме того, исследователи протестировали ResNet и…

В FAIR робота обучили управлять объектами по видеотьюториалам с помощью RL

19 февраля 2021

В FAIR робота обучили управлять объектами по видеотьюториалам с помощью RL

В FAIR RL-агента обучили управлять объектами по видеотьюториалам. Стандартные RL-алгоритмы обучаются задаче итеративно через обучение на ошибках. Предложенный алгоритм выучивает модель среды, наблюдает за поведением человека, а затем определяет функцию…

SAM: нейросеть меняет возраст на изображении лица человека

17 февраля 2021

SAM: нейросеть меняет возраст на изображении лица человека

SAM — это нейросетевая модель, которая меняет возраст человека на изображении. Модель принимает на вход изображение лица человека и целевой возраст. На выходе нейросеть отдает сгенерированное изображение, где лицо целевой…

Нейросеть от FAIR генерирует подписи к фото для людей с проблемами зрения

17 февраля 2021

Нейросеть от FAIR генерирует подписи к фото для людей с проблемами зрения

Нейросеть от Facebook AI генерирует описания к фотографиям для пользователей с проблемами зрения. Система использует распознавание объектов, чтобы генерировать текстовые описания изображения. Это упрощает использование Facebook для пользователей с проблемами…

MeInGame: нейросеть генерирует игрового персонажа по изображению лица

15 февраля 2021

MeInGame: нейросеть генерирует игрового персонажа по изображению лица

MeInGame — это нейросетевая модель, которая генерирует персонажа в игре по одному изображению лица. Нейросеть предсказывает форму лица и его текстуру. Итоговое предсказание можно внедрить в большинство существующих 3D игр.…

JigsawGAN: генеративная нейросетевая модель собирает пазлы

11 февраля 2021

JigsawGAN: генеративная нейросетевая модель собирает пазлы

JigsawGAN — это генеративная self-supervised нейросетевая модель, которую обучили на задаче сбора пазлов. Модель принимает на вход хаотично расположенные части изображения и на выходе выдает оригинальное изображение. Нейросеть не требует…

TracIn: способ оценить влияние отдельных объектов в данных на предсказания

10 февраля 2021

TracIn: способ оценить влияние отдельных объектов в данных на предсказания

TracIn — это масштабируемый метод оценки влияния отдельных объектов в данных на предсказания. Идея TracIn заключается в том, что бы отслеживать процесс обучения модели, чтобы засекать изменения в предсказаниях при…

DNS: соревнование по фильтрации шума на аудиозаписи от Microsoft

31 января 2021

DNS: соревнование по фильтрации шума на аудиозаписи от Microsoft

Deep Noise Suppression (DNS) — это соревнование по фильтрации шума на аудиозаписи от Microsoft. Соревнование разработали для того, что бы спровоцировать исследования в области улучшения качества аудиозаписей через фильтрацию шума.…

TAPAS: нейросеть ищет ответы на вопросы в табличных данных

30 января 2021

TAPAS: нейросеть ищет ответы на вопросы в табличных данных

TAPAS — это нейросетевая модель для поиска ответов на вопросы в табличных данных. Нейросеть является расширением двунаправленной Transformer-модели BERT со специальными эмбеддингами для поиска ответов. Модель разрабатывали в Google AI.…

Twitch Gamers: датасет для обучения представлений графов

30 января 2021

Twitch Gamers: датасет для обучения представлений графов

Twitch Gamers — это датасет для обучения представлений графовых данных. По результатам экспериментов, датасет подходит для оценки качества моделей обучения представлений. Создатели тестировали модели на задаче классификации узлов графа. Зачем…

ColTran: нейросеть раскрашивает черно-белые изображения

29 января 2021

ColTran: нейросеть раскрашивает черно-белые изображения

Colorization Transformer — это нейросетевая модель, которая окрашивает черно-белые изображения и основывается на механизме внимания. Модель принимает на вход черно-белое изображение. Процесс окрашивания проходит в три этапа. Сначала авторегрессионная Transformer-модель…

FaceX-Zoo: библиотека на PyTorch для распознавания лица на изображении

29 января 2021

FaceX-Zoo: библиотека на PyTorch для распознавания лица на изображении

FaceX-Zoo — это открытая библиотека на PyTorch для распознавания лица на изображениях. Библиотека предоставляет модуль для обучения моделей с разными конфигурациями функционала ошибки и базовой архитектуры. Кроме того, в FaceX-Zoo…

Pile: открытый датасет для обучения языковых моделей на 825 гигабайт

28 января 2021

Pile: открытый датасет для обучения языковых моделей на 825 гигабайт

Pile — это датасет с разнообразными текстами на 825 гигабайт для обучения языковых моделей. Датасет состоит из 22 датасетов меньшего размера, которые объединили в один. Кроме датасета, создатели опубликовали бенчмарк…