Нейросеть распознает действия на видео на основе ограниченного количества размеченных данных

15 марта 2020

Нейросеть распознает действия на видео на основе ограниченного количества размеченных данных

SSTDA — это self-supervised нейросетевая модель, которая распознает действия на видеозаписи. По результатам экспериментов, SSTDA обходит текущие state-of-the-art подходы на трех датасетах: GTEA, 50Salads и Breakfast. При этом модель требует…

State-of-the-art нейросеть для семантической сегментации с частичным привлечением учителя

24 февраля 2020

State-of-the-art нейросеть для семантической сегментации с частичным привлечением учителя

Нейросеть обучили семантически сегментировать объекты на изображении, имея только лейблы классов объектов без попиксельной разметки. Модель итеративно выучивает схожесть пикселей и выдает более правдоподобные маски объектов. Предложенный подход обходит предыдущие…

UPSNet: нейросеть для паноптической сегментации объектов на изображении

17 февраля 2020

UPSNet: нейросеть для паноптической сегментации объектов на изображении

UPSNet — это нейросетевая архитектура для паноптической сегментации объектов на изображении. Задача паноптической сегментации объединяет в себе семантическую и instance сегментации. Предыдущие методы имели две отдельные сети для семантической и…

Нейросеть сегментирует объекты на видеозаписи без размеченных данных

24 января 2020

Нейросеть сегментирует объекты на видеозаписи без размеченных данных

COSNet — это нейросетевая модель для unsupervised сегментации объектов на видео. Исследователи используют механизм глобального со-внимания, чтобы вычленить корреляцию между кадрами видеозаписи. COSNet обходит текущие state-of-the-art подходы в задаче unsupervised…

Agriculture-Vision: соревнование по применению компьютерного зрения для сельского хозяйства

16 января 2020

Agriculture-Vision: соревнование по применению компьютерного зрения для сельского хозяйства

Agriculture-Vision — это датасет для семантической сегментации с фотографиями фермерских полей. Изображения были сняты с воздуха. Всего в датасете около 95 тысяч фотографий в высоком разрешении с 3 тысяч угодий…

BlendMask: нейросеть обходит state-of-the-art на задаче сегментации объектов

8 января 2020

BlendMask: нейросеть обходит state-of-the-art на задаче сегментации объектов

BlendMask — это нейросетевая модель для instance сегментации объектов на изображении. Модель выдает более точные границы объектов, чем Mask R-CNN, на COCO датасете при схожих параметрах обучения. При этом BlendMask…

TensorMask: instance сегментация плотно расположенных объектов

30 октября 2019

TensorMask: instance сегментация плотно расположенных объектов

TensorMask — это алгоритм instance сегментации для распознавания плотно расположенных объектов на изображении. Нейросеть использует метод скользящего окна для сегментации объектов. Разработкой алгоритма занимались исследователи из FAIR. По результатам экспериментов,…

AdapIS: нейросеть для адаптивной instance сегментации изображения

8 октября 2019

AdapIS: нейросеть для адаптивной instance сегментации изображения

AdapIS (Adaptive Instance Selection) — это end-to-end нейросеть для instance сегментации объектов на изображении, которая устойчива к разным классам объектов. На вход модель принимает изображение с координатами расположения объекта. На…

DISCOMAN: датасет с размеченными изображениями интерьера

1 октября 2019

DISCOMAN: датасет с размеченными изображениями интерьера

DISCOMAN — это датасет с сгенерированными изображениями интерьера в высоком разрешении. Датасет содержит 200 разных траекторий передвижений на одной локации. Каждая траектория содержит от 3 до 5 тысяч кадров. Каждое…

A2D2: Audi опубликовали датасет для задачи автономного вождения

24 сентября 2019

A2D2: Audi опубликовали датасет для задачи автономного вождения

A2D2 — это датасет с размеченными изображениями дорог для обучения моделей автономному вождению. Данные собирали Audi. Сам датасет содержит в себе семантическую сегментацию изображений дорог, разметку облака точек. Для части…

Gated-SCNN: новый state-of-the-art в семантической сегментации

28 июля 2019

Gated-SCNN: новый state-of-the-art в семантической сегментации

Gated-SCNN — это двухпоточная сверточная нейросеть для семантической сегментации изображений. GSCNN обходит state-of-the-art архитектуры на 2-4% на задаче Cityscapes. Архитектура была разработана исследователями из NVIDIA. Текущие state-of-the-art методы для сегментации…

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

11 июня 2019

Нейросеть 3D-BoNet сегментирует объекты на 3D изображениях

3D-BoNet — это нейросетевая модель, которая распознает объекты на 3D изображениях и решает задачу instance сегментации в 10 раз более вычислительно эффективно по сравнению с существующими подходами. Под 3D изображением…

Нейросеть обучили диагностировать аневризму

9 июня 2019

Нейросеть обучили диагностировать аневризму

Стэнфордская группа машинного обучения, возглавляемая Эндрю Ыном, разработала модель, которая диагностирует внутричерепные аневризмы на снимках компьютерной томографической ангиографии (КТА) головы. Датасет содержал 818 обследований от 662 уникальных пациентов с 328…

Стартап OneSoil строит тепловые карты для прогноза урожайности

22 апреля 2019
onesoil

Стартап OneSoil строит тепловые карты для прогноза урожайности

Стартап OneSoil представил мобильное приложения для мониторинга роста агрокультур на основе ИИ. Белорусский старап превращает спутниковые данные в аналитику о состоянии почвы и сельскохозяйственных культур. Приложение доступно на Android и в на сайте…

Семантическая сегментация: краткое руководство

3 апреля 2019
semantic segmentation guide

Семантическая сегментация: краткое руководство

Cемантическая сегментация изображения означает присвоение каждому пикселю определенной метки. В этом заключается главное отличие от классификации, где всему изображению ставится в соответствие только одна метка. Сегментация работает со множеством объектов…

Nvidia представила набор инструментов для радиологов Clara AI

22 марта 2019

Nvidia представила набор инструментов для радиологов Clara AI

Nvidia продолжает фокусироваться на разработке аппаратного и программного обеспечения с ИИ для врачей. На GTC 2019 компания представила платформу Clara AI, которая содержит набор инструментов для разработки медицинского ПО и…

Вакансия Data scientist: вопросы и задачи на собеседовании

28 января 2019
вакансию data scientist - как проходит собеседование

Вакансия Data scientist: вопросы и задачи на собеседовании

Предложение вакансии Data scientist на рынке труда постоянно растет, количество соискателей тоже. Возможностей для входа в эту профессию много — курсы по специальности помогут получить необходимые знания. Блог Acing AI…

«Рутинные задачи с минимальным риском». Nature опубликовал доклад о развитии ИИ в медицине

10 января 2019

«Рутинные задачи с минимальным риском». Nature опубликовал доклад о развитии ИИ в медицине

Использование глубокого обучения в медицине активно развивается благодаря большому количеству размеченных снимков, возросшей вычислительной мощности и появлению облачных хранилищ данных. Нейронные сети влияют на состояние медицины на трех уровнях: помогают…

VGG16 — сверточная сеть для выделения признаков изображений

23 ноября 2018
vgg16 нейронная сеть

VGG16 — сверточная сеть для выделения признаков изображений

VGG16 — модель сверточной нейронной сети, предложенная K. Simonyan и A. Zisserman из Оксфордского университета в статье “Very Deep Convolutional Networks for Large-Scale Image Recognition”. Модель достигает точности 92.7% —…

Новые датасеты для оценки позы в 3D

12 ноября 2018

Новые датасеты для оценки позы в 3D

Оценка позы в 3D — фундаментальная задача компьютерного зрения. Способность компьютера распознавать людей на изображениях и видео применяется в беспилотном вождении, распознавании действий, взаимодействии человека с компьютером, дополненной реальности и робототехнике. В…

Fluid Annotation — инструмент для разметки изображений от Google AI

31 октября 2018

Fluid Annotation — инструмент для разметки изображений от Google AI

Работа моделей компьютерного зрения зависит от качества разметки объектов в обучающих датасетах. На разметку одного изображения из COCO+Stuff у человека уходит 19 минут, значит для обработки всего набора данных потребуется 53…