DeepFovea: нейросеть восстанавливает AR/VR объекты

19 ноября 2019

DeepFovea: нейросеть восстанавливает AR/VR объекты

DeepFovea — это система для фовеального рендеринга для AR/VR дисплеев, которая основана на нейросетях. Фовеальный рендеринг отвечает за визуализацию только той части экрана, на которую в текущий момент направлен взгляд…

SlowFast: архитектура для распознавания действий на видео

1 ноября 2019

SlowFast: архитектура для распознавания действий на видео

SlowFast — это нейросетевая архитектура, которая адаптирована для классификации действий на видео. Модель одновременно обрабатывает видео на высокой и низкой кадровой частоте. Нейросеть использует два канала обработки данных: первый фокусируется…

TensorMask: instance сегментация плотно расположенных объектов

30 октября 2019

TensorMask: instance сегментация плотно расположенных объектов

TensorMask — это алгоритм instance сегментации для распознавания плотно расположенных объектов на изображении. Нейросеть использует метод скользящего окна для сегментации объектов. Разработкой алгоритма занимались исследователи из FAIR. По результатам экспериментов,…

Detectron2: библиотека для распознавания объектов от FAIR

12 октября 2019

Detectron2: библиотека для распознавания объектов от FAIR

FAIR опубликовали Pytorch библиотеку для распознавания объектов Detectron2. В новой версии библиотеки появились модульный дизайн, имплементации state-of-the-art моделей, поддержка обучения моделей на нескольких GPU серверах и функционал для использования модели…

PHYRE: как обучить RL-агента решать физические задачи

16 августа 2019

PHYRE: как обучить RL-агента решать физические задачи

PHYRE — это 2D-симулятор с 50 видами физических головоломок для обучения RL-агентов. Всего в симуляторе 5 тысяч головоломок. Задачи были разработаны исследователями из Facebook AI. Несмотря на то, что головоломки…

Модель от FAIR для представления слов устойчива к опечаткам

12 августа 2019

Модель от FAIR для представления слов устойчива к опечаткам

Facebook AI Research опубликовали новую модель для обучения представлений слов, — MOE. Misspelling Oblivious Embeddings (MOE) комбинирует в себе модель fastText и задачу по подбору наиболее близкого слова к слову…

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

28 декабря 2018

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

Команда Facebook AI Research выложила в открытый доступ wav2letter ++ — модель распознавания речи, которая использует только сверточные нейронные сети (CNN). В задаче распознавания речи Wav2letter++ демонстрирует уровень ошибок 4.91-5% ,…

Машинное обучение делает Instagram доступным для слабовидящих

3 декабря 2018
instagram стал доступен слабовидящим

Машинное обучение делает Instagram доступным для слабовидящих

Instagram запускает две новые функции, которые смогут облегчить использование приложения — автоматическую генерацию текстовых описаний к фотографиям с помощью технологии распознавания объектов и добавление альтернативных описаний к фотографиям. Facebook использует машинное обучение для создания…

NYU School of Medicine выпустила датасет c 1,5 млн сканов МРТ

28 ноября 2018
датасет мрт-снимков

NYU School of Medicine выпустила датасет c 1,5 млн сканов МРТ

Центр инновационных исследований в области радиологии NYU School of Medicine совместно с Facebook AI Research (FAIR) выпустили крупный датасет, который содержит 1,5 млн МРТ-изображений коленных суставов. Набор данных создан в…

Deep Claster — алгоритм глубокой кластеризации. Он почти достиг человеческой точности

19 октября 2018
deep claster - кластеризация изображений

Deep Claster — алгоритм глубокой кластеризации. Он почти достиг человеческой точности

Кластеризация изображений считается хорошо изученной областью машинного обучения. Однако, на самом деле, до сих пор не было сделано значимых попыток адаптировать этот подход к изучению визуальных особенностей на датасетах высокого…

Чат-боты Facebook станут умнее благодаря комментариям на Reddit

27 сентября 2018

Чат-боты Facebook станут умнее благодаря комментариям на Reddit

Разработчики FAIR собрали датасет, который ускорит и повысит эффективность обучения диалоговых систем и чат-ботов Facebook. Датасет содержит 5 миллионов персонажей и 700 миллионов диалогов с сайта Reddit. В основе нового датасета набор данных PERSONA—CHAT,…

Facebook создали алгоритм для перевода с редких языков

5 сентября 2018
Facebook-AI-Research

Facebook создали алгоритм для перевода с редких языков

Для изучения нового языка алгоритмы машинного перевода требуют много текстовых данных. Нужный объём сложно получить, особенно в случае с редкими языками, например урду. Facebook AI Research представили новый подход для…

DeepWrinkles — нейросеть для создания детальных 3D-моделей одежды

28 августа 2018

DeepWrinkles — нейросеть для создания детальных 3D-моделей одежды

Facebook AI Research представляет новый подход под названием «DeepWrinkles» для создания реалистичной деформации одежды. Реалистичное моделирование одежды, как известно, представляет собой сложную задачу, и трудно недооценить её значимость в AR/VR,…

Сегментация людей на фотографии в сложных условиях

23 августа 2018

Сегментация людей на фотографии в сложных условиях

Понимание сцены — один из святых граалей сomputer vision. Проводится множество исследований, чтобы достичь абсолютного понимания того, что происходит на картинке. Получение любой дополнительной информации из изображения позволяет продвинуться по…

Исследователи из Facebook AI предложили подход для сегментации всего

26 июня 2018
image segmentation

Исследователи из Facebook AI предложили подход для сегментации всего

Сегментация сущностей на переднем и заднем планах изображения — впечатляющая способность детекторов, которые становятся все точнее и вариативнее. Но на практике модели сегментации ограничены узким участком визуального мира, который включает…