fbpx
  • GauGAN2: генерация реалистичных изображений по нескольким словам

    Нейросеть NVIDIA GauGAN2, обученная на 10 миллионах фотографий природы, генерирует реалистичные изображения по краткому описанию. Затем на изображение можно добавить новые объекты, нарисовав их эскиз от руки.

    GauGAN2 в рамках одной модели реализует построение карт сегментации, рисование и преобразование текста в изображение, что делает его мощным инструментом для создания фотореалистичного искусства с сочетанием слов и рисунков.

    Для этого генеративно-состязательная нейросеть была обучена с использованием суперкомпьютера NVIDIA Selene. Исследователи использовали нейронную сеть, которая изучает связь между словами и визуальными эффектами, которым они соответствуют, такими как “зима”, “туманный” или “радуга”.

    После генерации изображения можно создать карту семантической сегментации, которая показывает расположение объектов в сцене. Эту сцену можно дополнить с помощью простых набросков, например, неба, дерева, скалы или реки.

    Нейросеть можно протестировать в NVIDIA AI DEMOS.

    Подписаться
    Уведомить о
    guest
    0 Comments
    Межтекстовые Отзывы
    Посмотреть все комментарии