Sora: диффузионная text-to-image модель OpenAI

18 февраля 2024
openai sora

Sora: диффузионная text-to-image модель OpenAI

OpenAI представила Sora – диффузионную text-to-image модель, генерирующую видео длительностью 60 секунд. Ключевые преимущества модели OpenAI по сравнению с решениями конкурентов (включая Runway, Pika, Stability AI и Google) – высокое…

You.com обучили отвечать на многоэтапные поисковые запросы

28 января 2024

You.com обучили отвечать на многоэтапные поисковые запросы

В поисковый сервис You.com, предоставляющий персонализированные ответы с помощью языковых моделей, добавили три новых режима – Genius, Create и Research. В данных режимах сервис выдает ответ в виде сгенерированных изображений…

Pika 1.0: веб-платформа для генерации видео

7 января 2024
pika

Pika 1.0: веб-платформа для генерации видео

Стартап Pika Labs запустил Pika 1.0 – бесплатную веб-платформу для генерации и редактирования видео с помощью текстовых запросов. Сервис создает как реалистичные видео, так и 3D-анимацию в различных стилях. При…

VideoPoet: языковая модель Google для генерации и редактирования видео

23 декабря 2023
videopoet

VideoPoet: языковая модель Google для генерации и редактирования видео

Google представила VideoPoet – языковую модель для мультимодальной работы с видеоконтентом, способную преобразовывать текст и изображение в ролики, стилизовать существующие видео и генерировать аудиодорожки к ним без подсказок. VideoPoet обучает…

Google MusicFX: создание музыки по текстовому запросу

17 декабря 2023

Google MusicFX: создание музыки по текстовому запросу

Google запустил MusicFX – онлайн-сервис для генерации музыки по текстовому запросу. В продукте используется модель Google MusicLM, а каждый аудиофайл содержит незаметный для слушателя водяной знак, сгенерированный с помощью DeepMind…

Shopping Muse: рекомендательная система Mastercard

10 декабря 2023

Shopping Muse: рекомендательная система Mastercard

Mastercard представила Shopping Muse – модуль для интернет-магазинов в формате чат-бота, рекомендующий покупателю товары на основе его истории покупок и поиска, региона и других признаков. Shopping Muse работает на базе…

Google представила набор языковых моделей Gemini

7 декабря 2023

Google представила набор языковых моделей Gemini

Google сообщила о создании Gemini – набора из трех языковых моделей, превосходящих конкурентов в 30 из 32 бенчмарках. Старшая модель Gemini Ultra доступна через API, средняя Gemini Pro будет использоваться…

Stable Video Diffusion: генератор видео по изображению от Stability AI

26 ноября 2023
Stable Video Diffusion

Stable Video Diffusion: генератор видео по изображению от Stability AI

Компания Stability AI объявила о выпуске Stable Video Diffusion – набора из двух моделей, генерирующих видео продолжительностью до 4 секунд по входному изображению. Обе модели опубликованы в открытом доступе. Модели…

LCM-LoRA: генерация изображений в реальном времени

19 ноября 2023

LCM-LoRA: генерация изображений в реальном времени

Исследователи Университета Цинхуа разработали алгоритм LCM-LoRA, позволяющий в реальном времени генерировать изображения по текстовому описанию или наброску. Наиболее популярным text-to-image моделям, таким как Stable Diffusion, Midjourney и DALLE-3, требуется от…

Adobe Firefly 2 объединила модели генерации изображений и переноса стиля

11 октября 2023
adobe firefly 2 - generative match

Adobe Firefly 2 объединила модели генерации изображений и переноса стиля

Adobe представила бета-версию модели для генерации изображений Firefly 2, соединяющую в себе функции text-to-image и style transfer. Инструмент Generative Match в Firefly 2 позволяет сочетать текстовые запросы с референсным изображением,…

Microsoft Copilot и другие 150 AI-функций Windows 11

1 октября 2023
copilot

Microsoft Copilot и другие 150 AI-функций Windows 11

Microsoft выпустила обновление Windows 11, включающее более 150 AI-функций и чат-бота Copilot, поддерживающего большинство приложений операционной системы. Copilot является единой точкой входа для взаимодействия с приложениями и контентом с помощью…

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

29 сентября 2023
TinyML & Efficient DL Computing

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

В последние годы большие языковые и диффузные модели продемонстрировали впечатляющие результаты, но их требовательность к вычислительным ресурсам и потребление памяти ставит перед исследователями и разработчиками серьезные вызовы. Курс TinyML &…

NudsTopBot: нейросеть, которая раздевает по фотографии

23 сентября 2023
нейросеть раздевает по фото

NudsTopBot: нейросеть, которая раздевает по фотографии

NudsTopBot — это нейросеть, которая раздевает людей по фото, работает в виде Telegram-бота. Для начала работы с нейросетью нужен Telegram-аккаунт и фото девушки или мужчины в одежде. Качество раздевания ботом…

Hiber3D: создание метавселенных с помощью естественного языка

10 сентября 2023
Hiber3D creating metaverses with LLM

Hiber3D: создание метавселенных с помощью естественного языка

Компания Hiber, разрабатывающая инструменты для создания метавселенных, объявила об интеграции с Google PaLM. Обновление Hiber3D позволит пользователям создавать и модифицировать 3D-сцены c помощью запросов на естественном языке. С помощью no-code…

Audiocraft: open source библиотека для генерации музыки и звуков

4 августа 2023
audiocraft

Audiocraft: open source библиотека для генерации музыки и звуков

Audiocraft — это PyTorch-библиотека с открытым исходным кодом для генерации музыки и звуков из текста, предназначенная для исследований в области генерации аудио с использованием глубокого обучения. Разработчики предоставили код двух…

Нейросети, которые помогут улучшить качество фото: 8 бесплатных онлайн сервисов

2 августа 2023
ai photo enhancer

Нейросети, которые помогут улучшить качество фото: 8 бесплатных онлайн сервисов

Рассмотрим онлайн сервисы на основе нейросетей, которые улучшают качество фото бесплатно. Бесплатно можно обработать от 5 изображений всего до нескольких изображений каждый день. Если вы хотите бесплатно обрабатывать множество фотографий,…

Обновление Google Bard: работа с изображениями и поддержка новых языков

16 июля 2023
google bard

Обновление Google Bard: работа с изображениями и поддержка новых языков

Google Bard обновилась – теперь она работает на 46 языках в более чем 200 странах, включая страны Европы и Бразилию. Новые функции включают работу с изображениями, каталогизацию диалогов и управление…

OpenAI выпустила плагин Code Interpreter, значительно расширяющий возможности ChatGPT

13 июля 2023
openai chatgpt code interpreter

OpenAI выпустила плагин Code Interpreter, значительно расширяющий возможности ChatGPT

Плагин Code Interpreter для ChatGPT теперь доступен в Beta-режиме всем пользователям с платной подпиской. Code Interpreter умеет работать не только с кодом, он позволяет анализировать данные, рисовать графики, обрабатывать изображения,…

DragGAN: open source модель для манипуляции созданными GAN изображениями

6 июля 2023
dragyourgan

DragGAN: open source модель для манипуляции созданными GAN изображениями

Исследователи из Института Макса Планка, MIT и Google представили подход DragGAN для манипуляции содержимым изображений, созданных с помощью GAN. Достаточно расставить несколько опорных и целевых точек на изображении, и модель…

AI.XYZ: персональный ИИ-ассистент для личных и рабочих задач

2 июля 2023
персональный ИИ ассистент

AI.XYZ: персональный ИИ-ассистент для личных и рабочих задач

Исследовательская лаборатория AI Foundation запустила AI.XYZ – платформу для создания личных ИИ-ассистентов. Компания заявляет, что AI.XYZ является первой в мире платформой для управления жизнью с использованием AI, позволяющей решать как…

MAGVIT: open source генеративный видео-трансформер 10 в 1

29 июня 2023
MAGVIT

MAGVIT: open source генеративный видео-трансформер 10 в 1

Исследователи из института Карнеги-Меллон, Google Research и Университета Джорджии представили open source модель генерации видео MAGVIT (Masked Generative Video Transformer). Единая модель MAGVIT способна улучшать FPS, экстраполировать кадры, создавать видео…