Code Llama: что умеет и как использовать state-of-the-art в написании кода

28 августа 2023
code llama model

Code Llama: что умеет и как использовать state-of-the-art в написании кода

Модель Code Llama — дообученная Llama 2 для написания, завершения и исправления кода, распространяемая бесплатно для коммерческих и исследовательских целей. Code Llama ускоряет написание кода, снижает порог входа для начинающих…

Audiocraft: open source библиотека для генерации музыки и звуков

4 августа 2023
audiocraft

Audiocraft: open source библиотека для генерации музыки и звуков

Audiocraft — это PyTorch-библиотека с открытым исходным кодом для генерации музыки и звуков из текста, предназначенная для исследований в области генерации аудио с использованием глубокого обучения. Разработчики предоставили код двух…

Llama 2 и Llama-2-Chat: новое поколение open source языковых моделей

19 июля 2023
Llama 2 update

Llama 2 и Llama-2-Chat: новое поколение open source языковых моделей

Новое поколение моделей Llama — это три большие языковые модели Llama 2 c 7, 13 и 70 миллиардами параметров, и дообученные для ведения диалогов модели Llama-2-Chat 7B, 34B и 70B.…

FAIR разработали фреймворк WyPR для сегментации 3D-сцен без учителя

18 мая 2021

FAIR разработали фреймворк WyPR для сегментации 3D-сцен без учителя

WyPR — фреймворк FAIR для сегментации 3D-сцен без учителя, обошедший современные методы на 6% по mIoU. Кроме модели, содержит настройку исходных данных и тестов. Зачем это нужно Понимание искусственными интеллектом…

Casual Conversations: датасет от FAIR, нацеленный на увеличение инклюзивности нейронных сетей

6 мая 2021
casual conversations dataset fair

Casual Conversations: датасет от FAIR, нацеленный на увеличение инклюзивности нейронных сетей

FAIR представил датасет Casual Conversations, состоящий из 45 186 видео с людьми разного возраста, пола и цвета кожи. Датасет позволит разработчикам оценивать однородность распознавания данных параметров моделями компьютерного зрения в…

FAIR разработали архитектуру DINO для анализа изображений без лейблов

3 мая 2021

FAIR разработали архитектуру DINO для анализа изображений без лейблов

DINO — инструмент от FAIR для самообучения современных моделей Visual Transformer. Фреймворк эффективно справляется с самостоятельным выделением важного содержимого на изображениях без лейблов. Код в открытом доступе. Зачем это нужно…

Fairness Flow: новый инструмент для оценки предвзятости ИИ от FAIR

7 апреля 2021
Fairness flow

Fairness Flow: новый инструмент для оценки предвзятости ИИ от FAIR

Fairness Flow – это набор инструментов диагностики, который помогает сравнить, насколько справедливо модели и разметчики лейблов работают для отдельных групп пользователей. Зачем это нужно Специалисты Facebook AI убеждены, что случаи…

SEER: self-supervised нейросеть с миллиардом параметров от FAIR

9 марта 2021

SEER: self-supervised нейросеть с миллиардом параметров от FAIR

SEER — это self-supervised нейросеть с миллиардом параметров от FAIR для задач компьютерного зрения. Предобученную на снимках из Instagram модель можно дообучать на своих задачах. Разработчики опубликовали библиотеку VISSL для…

MLS: мультиязычный датасет для распознавания речи от FAIR

4 марта 2021

MLS: мультиязычный датасет для распознавания речи от FAIR

Facebook AI опубликовали мультиязычный датасет для обучения моделей распознавания речи. Multilingual LibriSpeech (MLS) содержит 50 тысяч часов аудио с речью людей на 8 языках: английском, немецком, испанском, итальянском, португальском и…

Нейросеть от FAIR генерирует подписи к фото для людей с проблемами зрения

17 февраля 2021

Нейросеть от FAIR генерирует подписи к фото для людей с проблемами зрения

Нейросеть от Facebook AI генерирует описания к фотографиям для пользователей с проблемами зрения. Система использует распознавание объектов, чтобы генерировать текстовые описания изображения. Это упрощает использование Facebook для пользователей с проблемами…

Бот от FAIR научился играть в кооперативные игры со скрытой информацией

7 декабря 2019

Бот от FAIR научился играть в кооперативные игры со скрытой информацией

В FAIR агента обучили играть в кооперативную карточную игру Ханаби. Ханаби является базовой задачей для обучения игровых агентов, потому что содержит в себе и кооперацию, и скрытую информацию. Бот обыгрывает…

DeepFovea: нейросеть восстанавливает AR/VR объекты

19 ноября 2019

DeepFovea: нейросеть восстанавливает AR/VR объекты

DeepFovea — это система для фовеального рендеринга для AR/VR дисплеев, которая основана на нейросетях. Фовеальный рендеринг отвечает за визуализацию только той части экрана, на которую в текущий момент направлен взгляд…

SlowFast: архитектура для распознавания действий на видео

1 ноября 2019

SlowFast: архитектура для распознавания действий на видео

SlowFast — это нейросетевая архитектура, которая адаптирована для классификации действий на видео. Модель одновременно обрабатывает видео на высокой и низкой кадровой частоте. Нейросеть использует два канала обработки данных: первый фокусируется…

TensorMask: instance сегментация плотно расположенных объектов

30 октября 2019

TensorMask: instance сегментация плотно расположенных объектов

TensorMask — это алгоритм instance сегментации для распознавания плотно расположенных объектов на изображении. Нейросеть использует метод скользящего окна для сегментации объектов. Разработкой алгоритма занимались исследователи из FAIR. По результатам экспериментов,…

Detectron2: библиотека для распознавания объектов от FAIR

12 октября 2019

Detectron2: библиотека для распознавания объектов от FAIR

FAIR опубликовали Pytorch библиотеку для распознавания объектов Detectron2. В новой версии библиотеки появились модульный дизайн, имплементации state-of-the-art моделей, поддержка обучения моделей на нескольких GPU серверах и функционал для использования модели…

PHYRE: как обучить RL-агента решать физические задачи

16 августа 2019

PHYRE: как обучить RL-агента решать физические задачи

PHYRE — это 2D-симулятор с 50 видами физических головоломок для обучения RL-агентов. Всего в симуляторе 5 тысяч головоломок. Задачи были разработаны исследователями из Facebook AI. Несмотря на то, что головоломки…

Модель от FAIR для представления слов устойчива к опечаткам

12 августа 2019

Модель от FAIR для представления слов устойчива к опечаткам

Facebook AI Research опубликовали новую модель для обучения представлений слов, — MOE. Misspelling Oblivious Embeddings (MOE) комбинирует в себе модель fastText и задачу по подбору наиболее близкого слова к слову…

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

28 декабря 2018

Facebook выложил модель распознавания речи Wav2Letter++ в открытый доступ

Команда Facebook AI Research выложила в открытый доступ wav2letter ++ — модель распознавания речи, которая использует только сверточные нейронные сети (CNN). В задаче распознавания речи Wav2letter++ демонстрирует уровень ошибок 4.91-5% ,…

Машинное обучение делает Instagram доступным для слабовидящих

3 декабря 2018
instagram стал доступен слабовидящим

Машинное обучение делает Instagram доступным для слабовидящих

Instagram запускает две новые функции, которые смогут облегчить использование приложения — автоматическую генерацию текстовых описаний к фотографиям с помощью технологии распознавания объектов и добавление альтернативных описаний к фотографиям. Facebook использует машинное обучение для создания…

NYU School of Medicine выпустила датасет c 1,5 млн сканов МРТ

28 ноября 2018
датасет мрт-снимков

NYU School of Medicine выпустила датасет c 1,5 млн сканов МРТ

Центр инновационных исследований в области радиологии NYU School of Medicine совместно с Facebook AI Research (FAIR) выпустили крупный датасет, который содержит 1,5 млн МРТ-изображений коленных суставов. Набор данных создан в…

Deep Claster — алгоритм глубокой кластеризации. Он почти достиг человеческой точности

19 октября 2018
deep claster - кластеризация изображений

Deep Claster — алгоритм глубокой кластеризации. Он почти достиг человеческой точности

Кластеризация изображений считается хорошо изученной областью машинного обучения. Однако, на самом деле, до сих пор не было сделано значимых попыток адаптировать этот подход к изучению визуальных особенностей на датасетах высокого…