Annotate.online: платформа для автоматизации разметки данных

25 февраля 2020

Annotate.online: платформа для автоматизации разметки данных

Annotate.online — это платформа для автоматизации процесса разметки данных. Разметка данных для обучения моделей является ресурсоемких процессом. Это особенно актуально для задач компьютерного зрения. SuperAnnotate разработали инструмент, который облегчает ручную…

State-of-the-art нейросеть для семантической сегментации с частичным привлечением учителя

24 февраля 2020

State-of-the-art нейросеть для семантической сегментации с частичным привлечением учителя

Нейросеть обучили семантически сегментировать объекты на изображении, имея только лейблы классов объектов без попиксельной разметки. Модель итеративно выучивает схожесть пикселей и выдает более правдоподобные маски объектов. Предложенный подход обходит предыдущие…

Нейросетевая модель от MIT помогла в разработке нового антибиотика

21 февраля 2020

Нейросетевая модель от MIT помогла в разработке нового антибиотика

Исследователи из MIT обучили нейросеть на датасете фармацевтических соединений. Модель распознала молекулы, который убивают одни из самых опасных бактерий. Лекарство действует иначе, чем существующие антибактериальные медикаменты. На текущий момент это…

GANILLA: нейросеть генерирует иллюстрации из изображений

17 февраля 2020

GANILLA: нейросеть генерирует иллюстрации из изображений

GANILLA — это архитектура генеративно-состязательной нейросети для перевода изображения в иллюстрацию. Исследователи предложили метрики для количественной оценки моделей на задаче перевода изображения в изображение. По результатам экспериментов, GANILLA обходит state-of-the-art…

AutoFlip: фреймворк для автоматического изменения формата видео

17 февраля 2020

AutoFlip: фреймворк для автоматического изменения формата видео

Видео, которые снимали и редактировали для телевизора или десктопного компьютера обычно снимаются и просматриваются в соотношениях 16:9 или 4:3. С увеличением количества пользователей смартфонов ранее устойчивые соотношения уже не вмещаются…

TensorFlow Lattice: библиотека для интерпретации ML-алгоритмов

17 февраля 2020

TensorFlow Lattice: библиотека для интерпретации ML-алгоритмов

TF Lattice — это библиотека для обучения и интерпретации ML-моделей. Библиотека позволяет включать в модель доменные знания о данных. ML исследователи сталкиваются с ситуацией, когда тестовые данные значительно отличаются от…

Как в FAIR оптимизируют нейросетевые рекомендательные системы

17 февраля 2020

Как в FAIR оптимизируют нейросетевые рекомендательные системы

Большинство существующих исследований про нейросетевые рекомендательные системы фокусируются на деталях архитектуры моделей. При этом недостаточно внимания уделяется способам масштабирования моделей для их использования в реальных сервисах. Исследователи из FAIR опубликовали…

ClearGrasp: нейросеть обучили распознавать прозрачные объекты

17 февраля 2020

ClearGrasp: нейросеть обучили распознавать прозрачные объекты

ClearGrasp — это нейросетевой алгоритм для представления RGB-D изображений с прозрачными объектами в 3D. Совместно с моделью разработчики опубликовали датасет с синтетическими изображениями прозрачных объектов. С помощью ClearGrasp разработчики улучшили…

UPSNet: нейросеть для паноптической сегментации объектов на изображении

17 февраля 2020

UPSNet: нейросеть для паноптической сегментации объектов на изображении

UPSNet — это нейросетевая архитектура для паноптической сегментации объектов на изображении. Задача паноптической сегментации объединяет в себе семантическую и instance сегментации. Предыдущие методы имели две отдельные сети для семантической и…

Turing-NLG: в Microsoft обучили языковую модель с 17 миллиардами параметров

12 февраля 2020

Turing-NLG: в Microsoft обучили языковую модель с 17 миллиардами параметров

Turing Natural Language Generation (T-NLG) — это языковая модель с 17 миллиардами параметров, которую обучили исследователи из Microsoft. На данный момент это самая крупная языковая модель из существующих. T-NLG обходит…

CCMatrix: FAIR опубликовали датасет для обучения моделей машинного перевода

8 февраля 2020

CCMatrix: FAIR опубликовали датасет для обучения моделей машинного перевода

CCMatrix — это самый крупный датасет параллельных текстов для обучения моделей машинного перевода. Данные включают в себя 4.5 миллиарда параллельных предложений на 576 пар языков. Предложения собирали из открытого датасета…

HiPlot: библиотека для интерактивной визуализации многомерных данных

5 февраля 2020

HiPlot: библиотека для интерактивной визуализации многомерных данных

HiPlot — это библиотека для интерактивной визуализации многомерных данных. HiPlot использует параллельные графики и другие графические методы представления информации. Работать с библиотекой можно напрямую из Jupyter ноутбуков. Инструмент создавался для…

BREAK: данные, чтобы обучить нейросеть понимать суть вопроса

4 февраля 2020

BREAK: данные, чтобы обучить нейросеть понимать суть вопроса

BREAK — это датасет для решения задачи понимания сути вопроса нейросетью. Он предназначен для того, чтобы модели вычленяли из комплексных вопросов сущности, которые помогут при генерации ответов. Датасет состоит из…

LaserTagger: state-of-the-art модель для генерации текста от Google AI

3 февраля 2020

LaserTagger: state-of-the-art модель для генерации текста от Google AI

LaserTagger — это нейросетевая модель для генерации текста, которая размечает входную последовательность. Нейросеть рассматривает задачу генерации текста как задачу редактирования текста. Целевые тексты восстанавливаются из входных текстов с помощью трех…

RatLesNetv2: нейросеть сегментирует поражение мозга на томографическом снимке

2 февраля 2020

RatLesNetv2: нейросеть сегментирует поражение мозга на томографическом снимке

RatLesNetv2 — это 3D сверточная нейросеть, которая выделяет зону поражения мозга на томографическом снимке. Исследователи обучали модель на томографических снимках мозга грызунов. По результатам экспериментов, RatLesNetv2 выдала более точные или…

Autonomous Learning: библиотека для обучения RL-агентов на PyTorch

31 января 2020

Autonomous Learning: библиотека для обучения RL-агентов на PyTorch

Autonomous Learning — это объектно-ориентированная библиотека для обучения RL-агентов. Библиотека разрабатывалась, чтобы облегчить прототипирование и оценку новых RL-агентов. Кроме того, в библиотеке есть реализации последних алгоритмов глубокого обучения с подкреплением.…

PyTorch3D: библиотека для работы с 3D данными от FAIR

31 января 2020

PyTorch3D: библиотека для работы с 3D данными от FAIR

FAIR опубликовали библиотеку для обработки 3D данных. PyTorch3d предоставляет переиспользуемые компоненты для задач компьютерного зрения на 3D данных. Библиотека основывается на нейросетевом фреймворке PyTorch. Ключевой функционал библиотеки включает в себя:…

FaceShifter: нейросеть заменяет лица на фотографиях

31 января 2020

FaceShifter: нейросеть заменяет лица на фотографиях

FaceShifter — это двухступенчатый нейросетевой фреймворк для реалистичного переноса лица на изображение человека. Модель устойчива к окклюзии лиц на входных изображениях. Исследователи заявляют, что FaceShifter лучше, чем предыдущие подходы, сохраняет…

Advbox: библиотека для генерации состязательных примеров

31 января 2020

Advbox: библиотека для генерации состязательных примеров

Advbox — это открытая библиотека инструментов для проверки обученных нейросетей на уязвимости. Разработкой библиотеки занимались исследователи из Baidu. В библиотеке есть функционал для генерации, распознавания и защиты от состязательных примеров.…

Google AI опубликовали самую крупную карту нейронных связей в мозге

24 января 2020

Google AI опубликовали самую крупную карту нейронных связей в мозге

Google AI совместно с исследовательской командой FlyEM опубликовали коннектом мозга мухи. Коннектом — это описание структуры в нервной системе организма.  Коннектом получили с помощью 3D изображений половины мозга мухи. Он…

Google опубликовали 25 миллионов открытых датасетов

24 января 2020

Google опубликовали 25 миллионов открытых датасетов

Google запустили поисковый сервис датасетов для машинного обучения. Google Dataset Search позволяет искать данные из 25 миллионов открытых датасетов. Поисковая система отличается от аналогов тем, что Dataset Search не собирает…