Google Imagen: генерация фотореалистичных изображений по описанию

29 июня 2022

Google Imagen: генерация фотореалистичных изображений по описанию

Google представила Imagen — модель, трансформирующую текстовое описание в изображение c разрешением 1024×1024 пикселей. Imagen превзошла OpenAI DALL-E 2 по степени реалистичности изображений. Imagen является комбинацией языковых моделей-трансформеров, используемых для…

LAION-5B: крупнейший датасет пар изображение-текст

28 мая 2022

LAION-5B: крупнейший датасет пар изображение-текст

LAION-5B — датасет пар изображение-текст, собранных в Интернете. LAION-5B содержит более 5 миллиардов пар, что делает его крупнейшим среди аналогичных датасетов. AION-5B был собран путем парсинга датасета Common Crawl для…

Модель обучили выполнять кросс-модальный поиск действий

9 мая 2022

Модель обучили выполнять кросс-модальный поиск действий

В MIT разработали модель кросс-модального поиска действий в текстовом, аудио- и видеоконтенте. Модель позволяет определить, где в видео происходит определенное действие, и идентифицировать его. Алгоритм обучен представлять данные таким образом,…

Flamingo: мультимодальная модель DeepMind

9 мая 2022

Flamingo: мультимодальная модель DeepMind

Flamingo – мультимодальная модель DeepMind, генерирующая текстовое описание фото, видео и звуков. Модель превосходит предыдущие state-of-the-art модели в 16 задачах, а ее особенностью является возможность обучаться на нескольких примерах. Обычно…

Google Cloud Manufacturing: расширенная аналитика на производствах

9 мая 2022

Google Cloud Manufacturing: расширенная аналитика на производствах

Google и Ford разработали инструмент Google Cloud Manufacturing, нацеленный на объединение и унификацию разрозненных данных на производствах. Инструмент предоставляет возможность анализировать производственные процессы и обучать широкий класс моделей. Операции на…

Алгоритм MIT для беспилотников предсказывает траектории объектов

29 апреля 2022

Алгоритм MIT для беспилотников предсказывает траектории объектов

Исследователи MIT разработали алгоритм для повышения безопасности беспилотных автомобилей. Модель предсказывает траектории передвигающихся рядом с беспилотником участников дорожного движения в реальном времени. Современные методы анализа дорожного движения либо слишком упрощены…

Модель предсказывает риск остановки сердца на десять лет вперед

14 апреля 2022

Модель предсказывает риск остановки сердца на десять лет вперед

В университете Джона Хопкинса разработали модель, прогнозирующую на основе снимков МРТ риск остановки сердца. Исследователи утверждают, что анализ структуры рубцовой ткани позволяет делать точные прогнозы на 10 лет вперед. Рубцовая…

DALL-E 2: text-to-image модель OpenAI

13 апреля 2022

DALL-E 2: text-to-image модель OpenAI

OpenAI представила новую версию модели преобразования текста в изображение DALL-E. По сравнению с первой версией, DALL-E 2 генерирует изображения в более высоком качестве с меньшей задержкой, а также позволяет редактировать…

Instant NeRF: сверхбыстрое восстановление 3D-сцен

28 марта 2022

Instant NeRF: сверхбыстрое восстановление 3D-сцен

Nvidia представила Instant NeRF – алгоритм сверхбыстрой реконструкции трехмерных сцен по нескольким изображениям. Instant NeRF нацелен на использование в системах автономного вождения и при создании метавлесенных. Алгоритм был продемонстрирован на…

Приложения машинного обучения в области охраны природы

28 февраля 2022

Приложения машинного обучения в области охраны природы

Машинное обучение вошло в тройку ведущих технологий в области охраны природы. В статье приводится обзор задач, решаемых с помощью машинного обучения – от оценки популяции шимпанзе до определения местонахождения китов.…

Система компьютерного зрения уменьшает задержки вылетов самолетов

28 февраля 2022

Система компьютерного зрения уменьшает задержки вылетов самолетов

Израильский стартап IntellAct разработал систему мониторинга действий сотрудников аэропорта для уменьшения задержек рейсов. Предварительные испытания системы, проведенные авиакомпанией El Al в аэропорту Бен-Гурион, показали, что она сокращает задержки вылетов на 15%.…

Система компьютерного зрения отслеживает свежесть продуктов

3 февраля 2022

Система компьютерного зрения отслеживает свежесть продуктов

Американская сеть продуктовых магазинов Albertsons внедрила систему мониторинга свежести продуктов на основе компьютерного зрения. Система работает в реальном времени на складах и магазинах сети, позволяя сократить количество отходов. Компании Albertsons…

Нейросеть обучили высокоточно отделять объект от фона

25 января 2022

Нейросеть обучили высокоточно отделять объект от фона

В Google разработали нейросеть, с высокой точностью отделяющую объект от фона на изображении. Модель используется в портретном режиме съемки на Pixel 6. При классической сегментации изображения каждый пиксель относится либо…

HyperStyle: фотореалистичное редактирование изображений

24 января 2022

HyperStyle: фотореалистичное редактирование изображений

HyperStyle — нейросеть, модифицирующая отдельные параметры объектов на фотографиях. C помощью HyperStyle можно изменить прическу человека или цвет машины. Нейросеть, обученная на изображениях объектов одного типа, позволяет практически в реальном времени…

На швейцарских железных дорогах внедрили систему мониторинга безопасности

21 января 2022

На швейцарских железных дорогах внедрили систему мониторинга безопасности

Baselland Transport AG, швейцарская компания общественного транспорта, внедрила систему обнаружения угроз для обеспечения безопасности железнодорожных перевозок. Система применяет технологии компьютерного зрения и машинного обучения для мониторинга и анализа состояния железнодорожного…

StylEx: визуализация ключевых атрибутов классификаторов

21 января 2022

StylEx: визуализация ключевых атрибутов классификаторов

Google представила StylEx — инструмент для выделения атрибутов, влияющих на классификаторы изображений. StylEx позволяет объяснить процесс принятия решения классификатором и находить ошибки в моделях. Определение того, какие признаки на изображении…

В NVIDIA Canvas добавили модель GauGAN2

7 января 2022

В NVIDIA Canvas добавили модель GauGAN2

NVIDIA выпустило обновление Canvas — бесплатного приложения для художников. Теперь в Canvas интегрирована модель GauGAN2, генерирующая изображения с высоким разрешением и детализацией по наброску или текстовому описанию. В NVIDIA Canvas…

FaceHeart: измерение медицинских показателей по видеозаписи лица

7 января 2022

FaceHeart: измерение медицинских показателей по видеозаписи лица

Корпорация FaceHeart объявила о запуске технологии, способной определять 6 медицинских показателей, включая уровень кислорода в крови и индекс стресса, с помощью камеры смартфона. В FaceHeart утверждают, что точность их системы…

Система Viz.ai ускоряет диагностику инсультов

7 января 2022

Система Viz.ai ускоряет диагностику инсультов

Стартап Viz.ai разработал алгоритм быстрой оценки вероятности инсульта у пациентов. Система используется более чем в 900 больницах США. Продукт Viz.ai использует машинное обучение для ускорения принятия решения об оперировании пациента.…

Приложение Google ищет похожих животных на картинах

26 декабря 2021

Приложение Google ищет похожих животных на картинах

Google добавила в iOS- и Android-приложение Google Arts & Culture функцию Pet Portraits. Pet Portraits выполняет поиск двойника животного на объектах искусства. Схожая функция была доступна с 2018-го года для…

Dream: приложение для создания стилизованных изображений

14 декабря 2021

Dream: приложение для создания стилизованных изображений

Dream — бесплатное приложение, генерирующее стилизованные изображения на основе краткого описания и выбранного стиля. Приложение доступно на iOS и Android, а также как веб-приложение. Модели, преобразующие текст в изображение, не…