FAIR / Нейросети и глубокое обучение

Code Llama: что умеет и как использовать state-of-the-art в написании кода

28 августа 2023

Code Llama: что умеет и как использовать state-of-the-art в написании кода

Модель Code Llama — дообученная Llama 2 для написания, завершения и исправления кода, распространяемая бесплатно для коммерческих и исследовательских целей. Code Llama ускоряет написание кода, снижает порог входа для начинающих…

Audiocraft: open source библиотека для генерации музыки и звуков

4 августа 2023

Audiocraft: open source библиотека для генерации музыки и звуков

Audiocraft — это PyTorch-библиотека с открытым исходным кодом для генерации музыки и звуков из текста, предназначенная для исследований в области генерации аудио с использованием глубокого обучения. Разработчики предоставили код двух…

Llama 2 и Llama-2-Chat: новое поколение open source языковых моделей

19 июля 2023

Llama 2 и Llama-2-Chat: новое поколение open source языковых моделей

Новое поколение моделей Llama — это три большие языковые модели Llama 2 c 7, 13 и 70 миллиардами параметров, и дообученные для ведения диалогов модели Llama-2-Chat 7B, 34B и 70B.…

FAIR разработали фреймворк WyPR для сегментации 3D-сцен без учителя

18 мая 2021

FAIR разработали фреймворк WyPR для сегментации 3D-сцен без учителя

WyPR — фреймворк FAIR для сегментации 3D-сцен без учителя, обошедший современные методы на 6% по mIoU. Кроме модели, содержит настройку исходных данных и тестов. Зачем это нужно Понимание искусственными интеллектом…

Casual Conversations: датасет от FAIR, нацеленный на увеличение инклюзивности нейронных сетей

6 мая 2021

Casual Conversations: датасет от FAIR, нацеленный на увеличение инклюзивности нейронных сетей

FAIR представил датасет Casual Conversations, состоящий из 45 186 видео с людьми разного возраста, пола и цвета кожи. Датасет позволит разработчикам оценивать однородность распознавания данных параметров моделями компьютерного зрения в…

FAIR разработали архитектуру DINO для анализа изображений без лейблов

3 мая 2021

FAIR разработали архитектуру DINO для анализа изображений без лейблов

DINO — инструмент от FAIR для самообучения современных моделей Visual Transformer. Фреймворк эффективно справляется с самостоятельным выделением важного содержимого на изображениях без лейблов. Код в открытом доступе. Зачем это нужно…

Fairness Flow: новый инструмент для оценки предвзятости ИИ от FAIR

7 апреля 2021

Fairness Flow: новый инструмент для оценки предвзятости ИИ от FAIR

Fairness Flow – это набор инструментов диагностики, который помогает сравнить, насколько справедливо модели и разметчики лейблов работают для отдельных групп пользователей. Зачем это нужно Специалисты Facebook AI убеждены, что случаи…

SEER: self-supervised нейросеть с миллиардом параметров от FAIR

9 марта 2021

SEER: self-supervised нейросеть с миллиардом параметров от FAIR

SEER — это self-supervised нейросеть с миллиардом параметров от FAIR для задач компьютерного зрения. Предобученную на снимках из Instagram модель можно дообучать на своих задачах. Разработчики опубликовали библиотеку VISSL для…

MLS: мультиязычный датасет для распознавания речи от FAIR

4 марта 2021

MLS: мультиязычный датасет для распознавания речи от FAIR

Facebook AI опубликовали мультиязычный датасет для обучения моделей распознавания речи. Multilingual LibriSpeech (MLS) содержит 50 тысяч часов аудио с речью людей на 8 языках: английском, немецком, испанском, итальянском, португальском и…

Нейросеть от FAIR генерирует подписи к фото для людей с проблемами зрения

17 февраля 2021

Нейросеть от FAIR генерирует подписи к фото для людей с проблемами зрения

Нейросеть от Facebook AI генерирует описания к фотографиям для пользователей с проблемами зрения. Система использует распознавание объектов, чтобы генерировать текстовые описания изображения. Это упрощает использование Facebook для пользователей с проблемами…

Бот от FAIR научился играть в кооперативные игры со скрытой информацией

7 декабря 2019

Бот от FAIR научился играть в кооперативные игры со скрытой информацией

В FAIR агента обучили играть в кооперативную карточную игру Ханаби. Ханаби является базовой задачей для обучения игровых агентов, потому что содержит в себе и кооперацию, и скрытую информацию. Бот обыгрывает…

DeepFovea: нейросеть восстанавливает AR/VR объекты

19 ноября 2019

DeepFovea: нейросеть восстанавливает AR/VR объекты

DeepFovea — это система для фовеального рендеринга для AR/VR дисплеев, которая основана на нейросетях. Фовеальный рендеринг отвечает за визуализацию только той части экрана, на которую в текущий момент направлен взгляд…

SlowFast: архитектура для распознавания действий на видео

1 ноября 2019

SlowFast: архитектура для распознавания действий на видео

SlowFast — это нейросетевая архитектура, которая адаптирована для классификации действий на видео. Модель одновременно обрабатывает видео на высокой и низкой кадровой частоте. Нейросеть использует два канала обработки данных: первый фокусируется…

TensorMask: instance сегментация плотно расположенных объектов

30 октября 2019

TensorMask: instance сегментация плотно расположенных объектов

TensorMask — это алгоритм instance сегментации для распознавания плотно расположенных объектов на изображении. Нейросеть использует метод скользящего окна для сегментации объектов. Разработкой алгоритма занимались исследователи из FAIR. По результатам экспериментов,…

Detectron2: библиотека для распознавания объектов от FAIR

12 октября 2019

Detectron2: библиотека для распознавания объектов от FAIR

FAIR опубликовали Pytorch библиотеку для распознавания объектов Detectron2. В новой версии библиотеки появились модульный дизайн, имплементации state-of-the-art моделей, поддержка обучения моделей на нескольких GPU серверах и функционал для использования модели…

PHYRE: как обучить RL-агента решать физические задачи

16 августа 2019

PHYRE: как обучить RL-агента решать физические задачи

PHYRE — это 2D-симулятор с 50 видами физических головоломок для обучения RL-агентов. Всего в симуляторе 5 тысяч головоломок. Задачи были разработаны исследователями из Facebook AI. Несмотря на то, что головоломки…

Модель от FAIR для представления слов устойчива к опечаткам

12 августа 2019

Модель от FAIR для представления слов устойчива к опечаткам

Facebook AI Research опубликовали новую модель для обучения представлений слов, — MOE. Misspelling Oblivious Embeddings (MOE) комбинирует в себе модель fastText и задачу по подбору наиболее близкого слова к слову…

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

28 декабря 2018

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

Команда Facebook AI Research выложила в открытый доступ wav2letter ++ — модель распознавания речи, которая использует только сверточные нейронные сети (CNN). В задаче распознавания речи Wav2letter++ демонстрирует уровень ошибок 4.91-5% ,…

Машинное обучение делает Instagram доступным для слабовидящих

3 декабря 2018

Машинное обучение делает Instagram доступным для слабовидящих

Instagram запускает две новые функции, которые смогут облегчить использование приложения — автоматическую генерацию текстовых описаний к фотографиям с помощью технологии распознавания объектов и добавление альтернативных описаний к фотографиям. Facebook использует машинное обучение для создания…