Классификация изображений / Нейросети и глубокое обучение

MinerU — open-source модель для извлечения данных из документов с точностью 93,5%

30 сентября 2024

MinerU — open-source модель для извлечения данных из документов с точностью 93,5%

MinerU — open-source модель для извлечения и структурирования контента из документов, представленная исследователями из Лаборатории Искусственного Интеллекта Шанхая. MinerU автоматизирует извлечение текста, формул, таблиц и изображений из документов, таких как…

Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT

20 сентября 2023

Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT

OpenAI объявила о выходе Dall-E 3 в интерфейсе ChatGPT в начале октября. В анонсе исследователи рассказали, что новая версия нейросети для генерации изображений значительно превосходит Dall-E-2 по нескольким критериям. Dall-E…

Модель обучили распознавать материалы предметов на фото

28 мая 2023

Модель обучили распознавать материалы предметов на фото

Исследователи MIT и Adobe Research разработали инструмент, идентифицирующий материал предметов на фотографиях. Потенциальные приложения метода включают понимание сцен роботами, редактирование статичного и видеоконтента, а также улучшение рекомендательный систем в интернет-магазинах.…

Adobe добавила AI-инструменты в Premiere Pro и After Effects

13 апреля 2023

Adobe добавила AI-инструменты в Premiere Pro и After Effects

Adobe анонсировала новые версии Premiere Pro и After Effects, в которых добавлен AI-функционал, позволяющий ускорить редактирование видео. Среди новых инструментов – редактирование видео по автоматически сгенерированной транскрипции и автоподбор цветового…

В Google AI обучили модель определять состояние организма по фото глаз

30 марта 2023

В Google AI обучили модель определять состояние организма по фото глаз

Google AI опубликовали исследование, показывающее, что дефицит или избыток ряда системных биомаркеров, охватывающих почки, кровь и печень, можно предсказать по фотографиям глаз. Точность метода превосходит точность стандартных моделей логистической регрессии,…

Генератор синтетических изображений для обучения моделей классификации

4 апреля 2022

Генератор синтетических изображений для обучения моделей классификации

Исследователи MIT разработали метод, в котором контролируемый генератор синтетических изображений интегрируется в модель классификации. Метод позволяет сократить затраты на сбор крупномасштабных датасетов. Создание датасетов для классификации может стоить миллионы долларов.…

Приложения машинного обучения в области охраны природы

28 февраля 2022

Приложения машинного обучения в области охраны природы

Машинное обучение вошло в тройку ведущих технологий в области охраны природы. В статье приводится обзор задач, решаемых с помощью машинного обучения – от оценки популяции шимпанзе до определения местонахождения китов.…

StylEx: выделение ключевых атрибутов классификаторов

21 января 2022

StylEx: выделение ключевых атрибутов классификаторов

Google представила StylEx — инструмент для выделения атрибутов модели, влияющих на классификаторы изображений. StylEx позволяет объяснить процесс принятия решения классификатором и находить ошибки в моделях. Определение того, какие признаки на…

Visual Genome: датасет размеченных изображений

25 ноября 2021

Visual Genome: датасет размеченных изображений

Visual Genome — датасет с более чем 100 000 изображений и описаний всех объектов на них. Датасет нацелен на использование в задачах поиска и распознавания объектов. Visual Genome является самым…

Нейросеть подтвердила подлинность картины да Винчи

31 августа 2021

Нейросеть подтвердила подлинность картины да Винчи

Сверточная нейросеть определила, что картина «Спаситель мира», авторство которой является предметом дебатов экспертов-искусствоведов, была написана Леонардо да Винчи. Теперь исследователи планируют применить нейросети к широкому классу других картин со спорным…

Know Your Data: инструмент анализа датасетов Google

27 августа 2021

Know Your Data: инструмент анализа датасетов Google

Know Your Data — инструмент Google для изучения и анализа датасетов. Приложение нацелено на поиск некорректных аннотаций и несбалансированных классов данных. Know Your Data — приложение с графическим интерфейсом, позволяющее…

Алгоритмы CV превзошли человека в распознавании образов

26 августа 2021

Алгоритмы CV превзошли человека в распознавании образов

Модель Alibaba AliceMind заняла первое место в соревновании VQA Challenge 2021, на котором требовалось ответить на 1.1 млн вопросов о 250 000 изображениях. Алгоритм Alibaba продемонстрировал точность распознавания 81,26%, в…

Архитектура Vision Outlooker установила рекорд точности классификации изображений без предобучения

27 июня 2021

Архитектура Vision Outlooker установила рекорд точности классификации изображений без предобучения

Vision Outlooker (VOLO) — вариация архитектуры Vision Transformer, призванная снизить зависимость от дополнительных обучающих данных. Достигнут рекордный показатель 87,1% на ImageNet без предобучения. Код в открытом доступе. Зачем это нужно…

В Юте вводится контроль состояния дорог на основе искусственного интеллекта

8 июня 2021

В Юте вводится контроль состояния дорог на основе искусственного интеллекта

ИИ-стартап Blyncsy представил технологию Payver, которая на основе данных видеорегистраторов предоставляет транспортным агентствам актуальную информацию о том, какие дороги требуют технического обслуживания и ремонта. Пилотный проект запущен в штате Юта…