В графический редактор Canva добавили преобразователь текста в изображение

12 ноября 2022
canva text to image sample

В графический редактор Canva добавили преобразователь текста в изображение

Инструмент для создания изображений по текстовой подсказке, встроенный в редактор Canva, основан на text-to-image генераторе Stable Diffusion с открытым исходным кодом. Пользователи могут бесплатно создавать до 100 изображений в день.…

OpenAI открыла доступ к DALL-E без списка ожидания

28 октября 2022

OpenAI открыла доступ к DALL-E без списка ожидания

OpenAI объявила, что пользователям больше не придется ждать своей очереди для получения доступа к сервису генерации изображений DALL-E AI. Теперь сервис доступен после прохождения регистрации на сайте: пользователю требуется подтвердить…

Google Imagen: генерация фотореалистичных изображений по описанию

29 июня 2022

Google Imagen: генерация фотореалистичных изображений по описанию

Google представила Imagen — модель, трансформирующую текстовое описание в изображение c разрешением 1024×1024 пикселей. Imagen превзошла OpenAI DALL-E 2 по степени реалистичности изображений. Imagen является комбинацией языковых моделей-трансформеров, используемых для…

Модель обучили выявлять сейсмическую активность на фоне городского шума

18 апреля 2022

Модель обучили выявлять сейсмическую активность на фоне городского шума

Исследователи Стэндфордского университета разработали алгоритм удаления фоновых шумов из данных, поступающих с датчиков сейсмической активности. Модель позволяет регистрировать в четыре раза больше сигналов землетрясений. Движение транспорта и работа производств генерируют…

DALL-E 2: text-to-image модель OpenAI

13 апреля 2022

DALL-E 2: text-to-image модель OpenAI

OpenAI представила новую версию модели преобразования текста в изображение DALL-E. По сравнению с первой версией, DALL-E 2 генерирует изображения в более высоком качестве с меньшей задержкой, а также позволяет редактировать…

Генератор синтетических изображений для обучения моделей классификации

4 апреля 2022

Генератор синтетических изображений для обучения моделей классификации

Исследователи MIT разработали метод, в котором контролируемая модель генерации синтетических изображений интегрируется в модель классификации. Метод позволяет сократить затраты на сбор крупномасштабных датасетов. Создание датасетов для классификации может стоить миллионы…

Boomy: генерация песен для публикации в стримингах

22 января 2022

Boomy: генерация песен для публикации в стримингах

Boomy — сайт и приложение, которое позволяет создавать песни на основе алгоритмов машинного обучения. С момента запуска сервиса его пользователи опубликовали более 100 000 песен в стриминговых сервисах. После выбора…

GLIDE: модель OpenAI генерации изображений по тексту

27 декабря 2021

GLIDE: модель OpenAI генерации изображений по тексту

GLIDE — модель OpenAI генерации изображения по его описанию. GLIDE превосходит DALL-E и при этом имеет в 3 раза меньше параметров. В январе 2021-го года OpenAI представила DALL-E, версию с…

GeoMol: предсказание структуры молекулы по ее графу

6 декабря 2021

GeoMol: предсказание структуры молекулы по ее графу

Исследователи MIT разработали нейросеть GeoMol, предсказывающую трехмерную структуру молекулы по ее двумерному графу. Этот метод может ускорить разработку новых лекарств. При разработке новых лекарств ученые ищут молекулы, которые могут присоединяться…

MvM: фреймворк Microsoft для генерации изображений

3 декабря 2021

MvM: фреймворк Microsoft для генерации изображений

Microsoft представила фреймворк для генерации изображений MvM. MvM превосходит генеративно-состязательные нейросети, а также позволяет использовать новые алгоритмы обучения в задачах компьютерного зрения. Возможности генеративно-состязательных нейросетей (GAN) в задачах компьютерного зрения…

GauGAN2: генерация реалистичных изображений по нескольким словам

24 ноября 2021

GauGAN2: генерация реалистичных изображений по нескольким словам

Нейросеть NVIDIA GauGAN2, обученная на 10 миллионах фотографий природы, генерирует реалистичные изображения по краткому описанию. Затем на изображение можно добавить новые объекты, нарисовав их эскиз от руки. GauGAN2 в рамках…

MetNet-2: модель Google предсказания погоды на 12 часов

16 ноября 2021

MetNet-2: модель Google предсказания погоды на 12 часов

Google AI представила MetNet-2 — улучшенную версию модели для предсказания погоды MetNet. MetNet-2 позволяет прогнозировать погоду на 12 часов вперед с пространственным разрешением 1 км и временным разрешением 2 минуты.…

Нейросеть проводит механические испытания материала на основе фотографий

27 апреля 2021

Нейросеть проводит механические испытания материала на основе фотографий

Исследователи из MIT разработали методику быстрого определения свойств материала на основе изображения, показывающего его внутреннюю структуру. Этот подход в будущем может устранить необходимость в трудных математических расчетах, опираясь на машинное…

Нейросеть от NVIDIA генерирует видеозаписи из облаков точек

18 июля 2020

Нейросеть от NVIDIA генерирует видеозаписи из облаков точек

NVIDIA опубликовали нейросетевой подход для генерации видеозаписей. Сцены на сгенерированных видеозаписях консистентны во времени и с разных точек обзора. Предыдущие модели для генерации видео не обеспечивали консистентность сцены. С каждым…

Нейросеть редактирует содержание изображения

17 июля 2020

Нейросеть редактирует содержание изображения

Исследователи из Hebrew University of Jerusalem обучили нейросеть, которая редактирует содержание изображение. Модель принимает на вход оригинальное изображение и карту сегментации отредактированного изображения. На выходе нейросеть выдает отредактированное в соответствии…

HiFiC: нейросеть реалистично сжимает изображения

20 июня 2020

HiFiC: нейросеть реалистично сжимает изображения

Задача сжатия размера изображения с минимальной потерей качества — это одна из актуальных проблем в компьютерном зрении. Для ее решения state-of-the-art подходом является использование GAN. Исследователи из Google Research проэкспериментировали…

Семантическая пирамида для генерации изображений

25 апреля 2020

Семантическая пирамида для генерации изображений

Исследователи из Google опубликовали нейросеть для генерации изображений, которая имеет иерархическую структуру. Подход основан на архитектуре генеративно-состязательной сети. Нейросеть использует пространство признаков, которое было предобучено с помощью модели классификации. Фреймворк…

House-GAN: нейросеть генерирует планировку дома по графу соседства комнат

13 апреля 2020

House-GAN: нейросеть генерирует планировку дома по графу соседства комнат

House-GAN — это нейросетевая генеративно-состязательная модель, которая на основе графа с расположением частей дома генерирует множество возможных планировок дома. Основная идея в House-GAN заключается в том, что бы кодировать ограничения…

CookGAN: нейросеть генерирует фото блюда по списку ингредиентов

27 февраля 2020

CookGAN: нейросеть генерирует фото блюда по списку ингредиентов

CookGAN — это генеративно-состязательная нейросеть, которая синтезирует реалистичное изображение блюда на основе списка ингредиентов. Модель основывается на StackGAN. Для того, что бы соотносить списки ингредиентов с изображениями, исследователи обучают отдельную…

Нейросеть генерирует видео с говорящим человеком по аудиозаписи

16 января 2020

Нейросеть генерирует видео с говорящим человеком по аудиозаписи

Исследователи из SenseTime опубликовали генеративную нейросеть, которая воспроизводит видеозапись говорящего человека по аудио с разговором. Модель принимает на вход изображение целевой персоны и аудиозапись с речью. На выходе модель отдает…

Нейросеть классифицирует фейковые и реальные изображения

31 декабря 2019

Нейросеть классифицирует фейковые и реальные изображения

Исследователи из UC Berkeley и Adobe Research обучили нейросетевой классификатор, который определяет фейковые изображения. Классификатор обучался на сгенерированных одной моделью изображениях. При этом он обобщается на изображения, которые были сгенерированы…