Модель обучили выполнять кросс-модальный поиск действий

9 мая 2022

Модель обучили выполнять кросс-модальный поиск действий

В MIT разработали модель кросс-модального поиска действий в текстовом, аудио- и видеоконтенте. Модель позволяет определить, где в видео происходит определенное действие, и идентифицировать его. Алгоритм обучен представлять данные таким образом,…

Flamingo: мультимодальная модель DeepMind

9 мая 2022

Flamingo: мультимодальная модель DeepMind

Flamingo – мультимодальная модель DeepMind, генерирующая текстовое описание фото, видео и звуков. Модель превосходит предыдущие state-of-the-art модели в 16 задачах, а ее особенностью является возможность обучаться на нескольких примерах. Обычно…

GraphWorld: бенчмарк для графовых нейросетей

9 мая 2022

GraphWorld: бенчмарк для графовых нейросетей

Google AI представила бенчмарк для графовых нейросетей GraphWorld. Бенчмарк использует несколько миллионов синтетических датасетов, воспроизводящих широкий класс графов, и генерирует обобщенную оценку нейросети на основе ее тестирования на всех датасетах.…

Израильский стартап упрощает найм сотрудников с использованием обработки естественного языка

9 мая 2022

Израильский стартап упрощает найм сотрудников с использованием обработки естественного языка

Myinterview – израильский стартап, разрабатывающий инструменты машинного обучения для ускорения и упрощения процессов найма для компаний. Платформа Myinterview расшифровывает видеоинтервью кандидатов, оценивает их навыки и выставляет оценку. Основатели утверждают, что…

Google Cloud Manufacturing: расширенная аналитика на производствах

9 мая 2022

Google Cloud Manufacturing: расширенная аналитика на производствах

Google и Ford разработали инструмент Google Cloud Manufacturing, нацеленный на объединение и унификацию разрозненных данных на производствах. Инструмент предоставляет возможность анализировать производственные процессы и обучать широкий класс моделей. Операции на…

Алгоритм MIT для беспилотников предсказывает траектории объектов

29 апреля 2022

Алгоритм MIT для беспилотников предсказывает траектории объектов

Исследователи MIT разработали алгоритм для повышения безопасности беспилотных автомобилей. Модель предсказывает траектории передвигающихся рядом с беспилотником участников дорожного движения в реальном времени. Современные методы анализа дорожного движения либо слишком упрощены…

MASSIVE: датасет Amazon для многоязычного обучения моделей

29 апреля 2022

MASSIVE: датасет Amazon для многоязычного обучения моделей

Amazon представил open-source датасет MASSIVE с переводами текстов на 51 язык. Датасет нацелен на создание моделей обработки естественного языка, которые могут быть легко обобщены на новые языки. В основе MASSIVE…

SORDI: датасет синтетических изображений производств

20 апреля 2022

SORDI: датасет синтетических изображений производств

BMW Group представила SORDI – крупнейший open-source датасет размеченных фотореалистичных изображений заводов и других производств. SORDI содержит более 800 000 изображений в 80 категориях и нацелен на развитие методов машинного…

Модель обучили выявлять сейсмическую активность на фоне городского шума

18 апреля 2022

Модель обучили выявлять сейсмическую активность на фоне городского шума

Исследователи Стэндфордского университета разработали алгоритм удаления фоновых шумов из данных, поступающих с датчиков сейсмической активности. Модель позволяет регистрировать в четыре раза больше сигналов землетрясений. Движение транспорта и работа производств генерируют…

Модель предсказывает риск остановки сердца на десять лет вперед

14 апреля 2022

Модель предсказывает риск остановки сердца на десять лет вперед

В университете Джона Хопкинса разработали модель, прогнозирующую на основе снимков МРТ риск остановки сердца. Исследователи утверждают, что анализ структуры рубцовой ткани позволяет делать точные прогнозы на 10 лет вперед. Рубцовая…

DALL-E 2: text-to-image модель OpenAI

13 апреля 2022

DALL-E 2: text-to-image модель OpenAI

OpenAI представила новую версию модели преобразования текста в изображение DALL-E. По сравнению с первой версией, DALL-E 2 генерирует изображения в более высоком качестве с меньшей задержкой, а также позволяет редактировать…

PaLM: языковая модель Google с 540 миллиардами параметров

8 апреля 2022

PaLM: языковая модель Google с 540 миллиардами параметров

Google представила PaLM – языковую модель с 540 миллиардами параметров. PaLM превзошла существующие языковые модели в большинстве бенчмарков. Модель обучена с использованием 6144 тензорных процессоров Google TPU на платформе параллельных…

Генератор синтетических изображений для обучения моделей классификации

4 апреля 2022

Генератор синтетических изображений для обучения моделей классификации

Исследователи MIT разработали метод, в котором контролируемая модель генерации синтетических изображений интегрируется в модель классификации. Метод позволяет сократить затраты на сбор крупномасштабных датасетов. Создание датасетов для классификации может стоить миллионы…

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

1 апреля 2022

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

Microsoft представила Jigsaw – инструмент откладки выдачи text-to-code моделей путем предоставления примеров выходных данных. При работе с Python Pandas инструмент позволил повысить точность Codex более чем в два раза. C…

Instant NeRF: сверхбыстрое восстановление 3D-сцен

28 марта 2022

Instant NeRF: сверхбыстрое восстановление 3D-сцен

Nvidia представила Instant NeRF – алгоритм сверхбыстрой реконструкции трехмерных сцен по нескольким изображениям. Instant NeRF нацелен на использование в системах автономного вождения и при создании метавлесенных. Алгоритм был продемонстрирован на…

Хирургический робот определяет место введения иглы

24 марта 2022

Хирургический робот определяет место введения иглы

AI-Guide – разработанный в MIT ручной хирургический робот, позволяющий автоматизировать процесс введения иглы или катетера в кровеносный сосуд. Устройство нацелено на оказание быстрой помощи в экстренных ситуациях. После несчастного случая…

Приложения машинного обучения в области охраны природы

28 февраля 2022

Приложения машинного обучения в области охраны природы

Машинное обучение вошло в тройку ведущих технологий в области охраны природы. В статье приводится обзор задач, решаемых с помощью машинного обучения – от оценки популяции шимпанзе до определения местонахождения китов.…

Система компьютерного зрения уменьшает задержки вылетов самолетов

28 февраля 2022

Система компьютерного зрения уменьшает задержки вылетов самолетов

Израильский стартап IntellAct разработал систему мониторинга действий сотрудников аэропорта для уменьшения задержек рейсов. Предварительные испытания системы, проведенные авиакомпанией El Al в аэропорту Бен-Гурион, показали, что она сокращает задержки вылетов на 15%.…

Датасеты для генерации и анализа музыки

27 февраля 2022

Датасеты для генерации и анализа музыки

В статье приводится обзор датасетов с музыкальными произведениями. Датасеты разработаны для обучения моделей генерации, распознавания и анализа музыки. NSynth Крупнейший датасет, состоящий из 305 979 музыкальных нот, включая высоту звука,…

Машинное обучение применили для помощи анастезиологам

18 февраля 2022

Машинное обучение применили для помощи анастезиологам

Ученые MIT продемонстрировали алгоритм машинного обучения для непрерывной автоматизации дозирования анестезирующего препарата пропофола. Алгоритм может улучшить процесс отслеживания состояния пациентов во время операции. Используя обучение с подкреплением, в котором нейронные сети…

Обучение с подкреплением для контроля термоядерных реакций

17 февраля 2022

Обучение с подкреплением для контроля термоядерных реакций

DeepMind объявила о применении обучения с подкреплением для управления состоянием плазмы в ходе термоядерной реакции. Алгоритм DeepMind позволил повысить стабильность процесса управляемого термоядерного синтеза на токамаке. Ядерный синтез — многообещающий…