MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

29 сентября 2023
TinyML & Efficient DL Computing

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

В последние годы большие языковые и диффузные модели продемонстрировали впечатляющие результаты, но их требовательность к вычислительным ресурсам и потребление памяти ставит перед исследователями и разработчиками серьезные вызовы. Курс TinyML &…

Reactor: генерация сцен по текстовому описанию

19 мая 2023
reactor parallel domains

Reactor: генерация сцен по текстовому описанию

Платформа Parallel Domain объявила о запуске Reactor – инструмента для работы с синтетическими данными, нацеленного на обучение беспилотных автомобилей и роботов. Интегрированная в Reactor языковая модель позволяет генерировать или модифицировать…

SORDI: датасет синтетических изображений производств

20 апреля 2022

SORDI: датасет синтетических изображений производств

BMW Group представила SORDI – крупнейший open-source датасет размеченных фотореалистичных изображений заводов и других производств. SORDI содержит более 800 000 изображений в 80 категориях и нацелен на развитие методов машинного…

Visual Genome: датасет размеченных изображений

25 ноября 2021

Visual Genome: датасет размеченных изображений

Visual Genome — датасет с более чем 100 000 изображений и описаний всех объектов на них. Датасет нацелен на использование в задачах поиска и распознавания объектов. Visual Genome является самым…

Hypersim: синтетический датасет Apple с изображениями интерьеров

5 августа 2021

Hypersim: синтетический датасет Apple с изображениями интерьеров

Apple представила Hypersim — синтетический датасет фотореалистичных изображений помещений и интерьеров. Hypersim состоит из 77 400 изображений 461 сцен и предоставляет семантическую сегментацию. Основным ограничением синтетических датасетов является отсутствие в…

Архитектура Vision Outlooker установила рекорд точности классификации изображений без предобучения

27 июня 2021

Архитектура Vision Outlooker установила рекорд точности классификации изображений без предобучения

Vision Outlooker (VOLO) — вариация архитектуры Vision Transformer, призванная снизить зависимость от дополнительных обучающих данных. Достигнут рекордный показатель 87,1% на ImageNet без предобучения. Код в открытом доступе. Зачем это нужно…

FAIR разработали фреймворк WyPR для сегментации 3D-сцен без учителя

18 мая 2021

FAIR разработали фреймворк WyPR для сегментации 3D-сцен без учителя

WyPR — фреймворк FAIR для сегментации 3D-сцен без учителя, обошедший современные методы на 6% по mIoU. Кроме модели, содержит настройку исходных данных и тестов. Зачем это нужно Понимание искусственными интеллектом…

Нейросеть распознает действия на видео на основе ограниченного количества размеченных данных

15 марта 2020

Нейросеть распознает действия на видео на основе ограниченного количества размеченных данных

SSTDA — это self-supervised нейросетевая модель, которая распознает действия на видеозаписи. По результатам экспериментов, SSTDA обходит текущие state-of-the-art подходы на трех датасетах: GTEA, 50Salads и Breakfast. При этом модель требует…

State-of-the-art нейросеть для семантической сегментации с частичным привлечением учителя

24 февраля 2020

State-of-the-art нейросеть для семантической сегментации с частичным привлечением учителя

Нейросеть обучили семантически сегментировать объекты на изображении, имея только лейблы классов объектов без попиксельной разметки. Модель итеративно выучивает схожесть пикселей и выдает более правдоподобные маски объектов. Предложенный подход обходит предыдущие…

UPSNet: нейросеть для паноптической сегментации объектов на изображении

17 февраля 2020

UPSNet: нейросеть для паноптической сегментации объектов на изображении

UPSNet — это нейросетевая архитектура для паноптической сегментации объектов на изображении. Задача паноптической сегментации объединяет в себе семантическую и instance сегментации. Предыдущие методы имели две отдельные сети для семантической и…

Нейросеть сегментирует объекты на видеозаписи без размеченных данных

24 января 2020

Нейросеть сегментирует объекты на видеозаписи без размеченных данных

COSNet — это нейросетевая модель для unsupervised сегментации объектов на видео. Исследователи используют механизм глобального со-внимания, чтобы вычленить корреляцию между кадрами видеозаписи. COSNet обходит текущие state-of-the-art подходы в задаче unsupervised…

Agriculture-Vision: соревнование по применению компьютерного зрения для сельского хозяйства

16 января 2020

Agriculture-Vision: соревнование по применению компьютерного зрения для сельского хозяйства

Agriculture-Vision — это датасет для семантической сегментации с фотографиями фермерских полей. Изображения были сняты с воздуха. Всего в датасете около 95 тысяч фотографий в высоком разрешении с 3 тысяч угодий…

BlendMask: нейросеть обходит state-of-the-art на задаче сегментации объектов

8 января 2020

BlendMask: нейросеть обходит state-of-the-art на задаче сегментации объектов

BlendMask — это нейросетевая модель для instance сегментации объектов на изображении. Модель выдает более точные границы объектов, чем Mask R-CNN, на COCO датасете при схожих параметрах обучения. При этом BlendMask…

TensorMask: instance сегментация плотно расположенных объектов

30 октября 2019

TensorMask: instance сегментация плотно расположенных объектов

TensorMask — это алгоритм instance сегментации для распознавания плотно расположенных объектов на изображении. Нейросеть использует метод скользящего окна для сегментации объектов. Разработкой алгоритма занимались исследователи из FAIR. По результатам экспериментов,…

AdapIS: нейросеть для адаптивной instance сегментации изображения

8 октября 2019

AdapIS: нейросеть для адаптивной instance сегментации изображения

AdapIS (Adaptive Instance Selection) — это end-to-end нейросеть для instance сегментации объектов на изображении, которая устойчива к разным классам объектов. На вход модель принимает изображение с координатами расположения объекта. На…

DISCOMAN: датасет с размеченными изображениями интерьера

1 октября 2019

DISCOMAN: датасет с размеченными изображениями интерьера

DISCOMAN — это датасет с сгенерированными изображениями интерьера в высоком разрешении. Датасет содержит 200 разных траекторий передвижений на одной локации. Каждая траектория содержит от 3 до 5 тысяч кадров. Каждое…

A2D2: Audi опубликовали датасет для задачи автономного вождения

24 сентября 2019

A2D2: Audi опубликовали датасет для задачи автономного вождения

A2D2 — это датасет с размеченными изображениями дорог для обучения моделей автономному вождению. Данные собирали Audi. Сам датасет содержит в себе семантическую сегментацию изображений дорог, разметку облака точек. Для части…

Gated-SCNN: новый state-of-the-art в семантической сегментации

28 июля 2019

Gated-SCNN: новый state-of-the-art в семантической сегментации

Gated-SCNN — это двухпоточная сверточная нейросеть для семантической сегментации изображений. GSCNN обходит state-of-the-art архитектуры на 2-4% на задаче Cityscapes. Архитектура была разработана исследователями из NVIDIA. Текущие state-of-the-art методы для сегментации…

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

11 июня 2019

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

3D-BoNet — это нейросетевая модель, которая распознает объекты на 3D изображениях и решает задачу instance сегментации в 10 раз более вычислительно эффективно по сравнению с существующими подходами. Под 3D изображением…

Нейросеть обучили диагностировать аневризму

9 июня 2019

Нейросеть обучили диагностировать аневризму

Стэнфордская группа машинного обучения, возглавляемая Эндрю Ыном, разработала модель, которая диагностирует внутричерепные аневризмы на снимках компьютерной томографической ангиографии (КТА) головы. Датасет содержал 818 обследований от 662 уникальных пациентов с 328…

Стартап OneSoil строит тепловые карты для прогноза урожайности

22 апреля 2019
onesoil

Стартап OneSoil строит тепловые карты для прогноза урожайности

Стартап OneSoil представил мобильное приложения для мониторинга роста агрокультур на основе ИИ. Белорусский старап превращает спутниковые данные в аналитику о состоянии почвы и сельскохозяйственных культур. Приложение доступно на Android и в на сайте…