MinerU — open-source модель для извлечения данных из документов с точностью 93,5%

30 сентября 2024
Structure AI document extraction ai

MinerU — open-source модель для извлечения данных из документов с точностью 93,5%

MinerU — open-source модель для извлечения и структурирования контента из документов, представленная исследователями из Лаборатории Искусственного Интеллекта Шанхая. MinerU автоматизирует извлечение текста, формул, таблиц и изображений из документов, таких как…

Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT

20 сентября 2023
Dalle-3

Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT

OpenAI объявила о выходе Dall-E 3 в интерфейсе ChatGPT в начале октября. В анонсе исследователи рассказали, что новая версия нейросети для генерации изображений значительно превосходит Dall-E-2 по нескольким критериям. Dall-E…

Модель обучили распознавать материалы предметов на фото

28 мая 2023
нейросеть распознает материалы на фото

Модель обучили распознавать материалы предметов на фото

Исследователи MIT и Adobe Research разработали инструмент, идентифицирующий материал предметов на фотографиях. Потенциальные приложения метода включают понимание сцен роботами, редактирование статичного и видеоконтента, а также улучшение рекомендательный систем в интернет-магазинах.…

Adobe добавила AI-инструменты в Premiere Pro и After Effects

13 апреля 2023

Adobe добавила AI-инструменты в Premiere Pro и After Effects

Adobe анонсировала новые версии Premiere Pro и After Effects, в которых добавлен AI-функционал, позволяющий ускорить редактирование видео. Среди новых инструментов – редактирование видео по автоматически сгенерированной транскрипции и автоподбор цветового…

В Google AI обучили модель определять состояние организма по фото глаз

30 марта 2023

В Google AI обучили модель определять состояние организма по фото глаз

Google AI опубликовали исследование, показывающее, что дефицит или избыток ряда системных биомаркеров, охватывающих почки, кровь и печень, можно предсказать по фотографиям глаз. Точность метода превосходит точность стандартных моделей логистической регрессии,…

Генератор синтетических изображений для обучения моделей классификации

4 апреля 2022

Генератор синтетических изображений для обучения моделей классификации

Исследователи MIT разработали метод, в котором контролируемый генератор синтетических изображений интегрируется в модель классификации. Метод позволяет сократить затраты на сбор крупномасштабных датасетов. Создание датасетов для классификации может стоить миллионы долларов.…

Приложения машинного обучения в области охраны природы

28 февраля 2022

Приложения машинного обучения в области охраны природы

Машинное обучение вошло в тройку ведущих технологий в области охраны природы. В статье приводится обзор задач, решаемых с помощью машинного обучения – от оценки популяции шимпанзе до определения местонахождения китов.…

StylEx: выделение ключевых атрибутов классификаторов

21 января 2022
выделение атрибутов модели stylex

StylEx: выделение ключевых атрибутов классификаторов

Google представила StylEx — инструмент для выделения атрибутов модели, влияющих на классификаторы изображений. StylEx позволяет объяснить процесс принятия решения классификатором и находить ошибки в моделях. Определение того, какие признаки на…

Visual Genome: датасет размеченных изображений

25 ноября 2021

Visual Genome: датасет размеченных изображений

Visual Genome — датасет с более чем 100 000 изображений и описаний всех объектов на них. Датасет нацелен на использование в задачах поиска и распознавания объектов. Visual Genome является самым…

Нейросеть подтвердила подлинность картины да Винчи

31 августа 2021

Нейросеть подтвердила подлинность картины да Винчи

Сверточная нейросеть определила, что картина «Спаситель мира», авторство которой является предметом дебатов экспертов-искусствоведов, была написана Леонардо да Винчи. Теперь исследователи планируют применить нейросети к широкому классу других картин со спорным…

Know Your Data: инструмент анализа датасетов Google

27 августа 2021

Know Your Data: инструмент анализа датасетов Google

Know Your Data — инструмент Google для изучения и анализа датасетов. Приложение нацелено на поиск некорректных аннотаций и несбалансированных классов данных. Know Your Data — приложение с графическим интерфейсом, позволяющее…

Алгоритмы CV превзошли человека в распознавании образов

26 августа 2021

Алгоритмы CV превзошли человека в распознавании образов

Модель Alibaba AliceMind заняла первое место в соревновании VQA Challenge 2021, на котором требовалось ответить на 1.1 млн вопросов о 250 000 изображениях. Алгоритм Alibaba продемонстрировал точность распознавания 81,26%, в…

Архитектура Vision Outlooker установила рекорд точности классификации изображений без предобучения

27 июня 2021

Архитектура Vision Outlooker установила рекорд точности классификации изображений без предобучения

Vision Outlooker (VOLO) — вариация архитектуры Vision Transformer, призванная снизить зависимость от дополнительных обучающих данных. Достигнут рекордный показатель 87,1% на ImageNet без предобучения. Код в открытом доступе. Зачем это нужно…

В Юте вводится контроль состояния дорог на основе искусственного интеллекта

8 июня 2021

В Юте вводится контроль состояния дорог на основе искусственного интеллекта

ИИ-стартап Blyncsy представил технологию Payver, которая на основе данных видеорегистраторов предоставляет транспортным агентствам актуальную информацию о том, какие дороги требуют технического обслуживания и ремонта. Пилотный проект запущен в штате Юта…

FAIR разработали архитектуру DINO для анализа изображений без лейблов

3 мая 2021

FAIR разработали архитектуру DINO для анализа изображений без лейблов

DINO — инструмент от FAIR для самообучения современных моделей Visual Transformer. Фреймворк эффективно справляется с самостоятельным выделением важного содержимого на изображениях без лейблов. Код в открытом доступе. Зачем это нужно…

OpenAI предложили новый метод оценки устойчивости GAN к состязательным атакам

23 августа 2019

OpenAI предложили новый метод оценки устойчивости GAN к состязательным атакам

UAR — это метод для оценки устойчивости классификатора к ранее незнакомым состязательным атакам от OpenAI. Функция потерь Unforeseen Attack Robustness оценивает, как нейросеть справляется с искаженными изображениями. Таким образом можно…

iCassava: нейросеть распознает болезни растений по изображению

21 августа 2019

iCassava: нейросеть распознает болезни растений по изображению

Недавно завершилось соревнование iCassava. Задача заключалась в разработке системы для выявления заболеваний у растения маниок на основе изображения его листьев. Маниок — это второй по популярности источник карбогидратов в Африке.…

ImageNet-A: как снизить точность предсказаний нейросети на 90%

27 июля 2019

ImageNet-A: как снизить точность предсказаний нейросети на 90%

ImageNet-A — это датасет с примерами изображений, которые нейросеть не может классифицировать верно. По результатам, модели предсказывали объекты из датасета с точностью в 3%. В то время как для стандартного…

ResNet (34, 50, 101): «остаточные» CNN для классификации изображений

29 января 2019
resnet-neural-network

ResNet (34, 50, 101): «остаточные» CNN для классификации изображений

ResNet — это сокращенное название для Residual Network (дословно  — «остаточная сеть»), но что такое residual learning («остаточное обучение»)? Глубокие сверточные нейронные сети превзошли человеческий уровень классификации изображений в 2015…

Бесплатные карты для автономного транспорта уже покрывают 6 миллионов км дорог

24 января 2019

Бесплатные карты для автономного транспорта уже покрывают 6 миллионов км дорог

Mapillary — открытая платформа, которая собирает фотографии улиц, сделанные людьми с помощью смартфонов. Сервис разработан одноименным шведским стартапом и нацелен на создание постоянно обновляющихся карт для беспилотного транспорта, в которых…

Нейросети Ringo оценивают чистоту бриллиантов перед покупкой

24 января 2019

Нейросети Ringo оценивают чистоту бриллиантов перед покупкой

Ringo — алгоритм на основе нейронных сетей, который анализирует фотографии бриллиантов и выдает рекомендации покупателям. Алгоритм работает в формате сервиса на сайте для покупки бриллиантов Diamonds Pro. Он находит несколько…