Google RecurrentGemma: локальная языковая модель

14 апреля 2024

Google RecurrentGemma: локальная языковая модель

Google представила языковую модель RecurrentGemma, работающую локально на устройствах с ограниченными ресурсами, таких как смартфоны, персональные компьютеры и умные колонки. Новая архитектура Google значительно снижает требования к памяти и процессору,…

Gretel: крупнейший открытый text-to-SQL датасет

7 апреля 2024

Gretel: крупнейший открытый text-to-SQL датасет

Стартап Gretel, специализирующийся на генерации высококачественных синтетических данных, объявил о создании крупнейшего открытого text-to-SQL датасета, нацеленного на ускорение развития no-code инструментов аналитики. Датасет содержит более 100 000 корректных синтетических образцов…

Voice Engine: синтез голоса от OpenAI

1 апреля 2024

Voice Engine: синтез голоса от OpenAI

OpenAI представила Voice Engine —  модель, выполняющую клонирование голоса по 15-секундной аудиозаписи. В компании среди пользователей модели указывают подкастеров, дикторов, авторов аудиокниг и рекламных роликов, стримеров и другие профессии. На…

В Midjourney добавили функцию переноса персонажа на новое изображение

17 марта 2024
перенос персонажа

В Midjourney добавили функцию переноса персонажа на новое изображение

В сервисе генерации изображений Midjourney появилась возможность переноса персонажа на новое изображение путем указания в запросе ссылки на уже существующее с ним изображение. Функция позволит использовать сервис для создания новых…

Ученые впервые разработали лекарство с помощью генеративных моделей

10 марта 2024
искусственный интеллект разрабатывает лекарство

Ученые впервые разработали лекарство с помощью генеративных моделей

Стартап Insilico Medicine представил первое лекарство, разработанное с помощью генеративных моделей. Новый подход к созданию позволил препарату пройти первую фазы клинических испытаний всего за два года – втрое быстрее, чем…

Sora: диффузионная text-to-image модель OpenAI

18 февраля 2024
openai sora

Sora: диффузионная text-to-image модель OpenAI

OpenAI представила Sora – диффузионную text-to-image модель, генерирующую видео длительностью 60 секунд. Ключевые преимущества модели OpenAI по сравнению с решениями конкурентов (включая Runway, Pika, Stability AI и Google) – высокое…

You.com обучили отвечать на многоэтапные поисковые запросы

28 января 2024

You.com обучили отвечать на многоэтапные поисковые запросы

В поисковый сервис You.com, предоставляющий персонализированные ответы с помощью языковых моделей, добавили три новых режима – Genius, Create и Research. В данных режимах сервис выдает ответ в виде сгенерированных изображений…

Pika 1.0: веб-платформа для генерации видео

7 января 2024
pika

Pika 1.0: веб-платформа для генерации видео

Стартап Pika Labs запустил Pika 1.0 – бесплатную веб-платформу для генерации и редактирования видео с помощью текстовых запросов. Сервис создает как реалистичные видео, так и 3D-анимацию в различных стилях. При…

VideoPoet: языковая модель Google для генерации и редактирования видео

23 декабря 2023
videopoet

VideoPoet: языковая модель Google для генерации и редактирования видео

Google представила VideoPoet – языковую модель для мультимодальной работы с видеоконтентом, способную преобразовывать текст и изображение в ролики, стилизовать существующие видео и генерировать аудиодорожки к ним без подсказок. VideoPoet обучает…

Google MusicFX: создание музыки по текстовому запросу

17 декабря 2023

Google MusicFX: создание музыки по текстовому запросу

Google запустил MusicFX – онлайн-сервис для генерации музыки по текстовому запросу. В продукте используется модель Google MusicLM, а каждый аудиофайл содержит незаметный для слушателя водяной знак, сгенерированный с помощью DeepMind…

Shopping Muse: рекомендательная система Mastercard

10 декабря 2023

Shopping Muse: рекомендательная система Mastercard

Mastercard представила Shopping Muse – модуль для интернет-магазинов в формате чат-бота, рекомендующий покупателю товары на основе его истории покупок и поиска, региона и других признаков. Shopping Muse работает на базе…

Google представила набор языковых моделей Gemini

7 декабря 2023

Google представила набор языковых моделей Gemini

Google сообщила о создании Gemini – набора из трех языковых моделей, превосходящих конкурентов в 30 из 32 бенчмарках. Старшая модель Gemini Ultra доступна через API, средняя Gemini Pro будет использоваться…

Stable Video Diffusion: генератор видео по изображению от Stability AI

26 ноября 2023
Stable Video Diffusion

Stable Video Diffusion: генератор видео по изображению от Stability AI

Компания Stability AI объявила о выпуске Stable Video Diffusion – набора из двух моделей, генерирующих видео продолжительностью до 4 секунд по входному изображению. Обе модели опубликованы в открытом доступе. Модели…

LCM-LoRA: генерация изображений в реальном времени

19 ноября 2023

LCM-LoRA: генерация изображений в реальном времени

Исследователи Университета Цинхуа разработали алгоритм LCM-LoRA, позволяющий в реальном времени генерировать изображения по текстовому описанию или наброску. Наиболее популярным text-to-image моделям, таким как Stable Diffusion, Midjourney и DALLE-3, требуется от…

Adobe Firefly 2 объединила модели генерации изображений и переноса стиля

11 октября 2023
adobe firefly 2 - generative match

Adobe Firefly 2 объединила модели генерации изображений и переноса стиля

Adobe представила бета-версию модели для генерации изображений Firefly 2, соединяющую в себе функции text-to-image и style transfer. Инструмент Generative Match в Firefly 2 позволяет сочетать текстовые запросы с референсным изображением,…

Microsoft Copilot и другие 150 AI-функций Windows 11

1 октября 2023
copilot

Microsoft Copilot и другие 150 AI-функций Windows 11

Microsoft выпустила обновление Windows 11, включающее более 150 AI-функций и чат-бота Copilot, поддерживающего большинство приложений операционной системы. Copilot является единой точкой входа для взаимодействия с приложениями и контентом с помощью…

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

29 сентября 2023
TinyML & Efficient DL Computing

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

В последние годы большие языковые и диффузные модели продемонстрировали впечатляющие результаты, но их требовательность к вычислительным ресурсам и потребление памяти ставит перед исследователями и разработчиками серьезные вызовы. Курс TinyML &…

NudsTopBot: нейросеть, которая раздевает по фотографии

23 сентября 2023
нейросеть раздевает по фото

NudsTopBot: нейросеть, которая раздевает по фотографии

NudsTopBot — это нейросеть, которая раздевает людей по фото, работает в виде Telegram-бота. Для начала работы с нейросетью нужен Telegram-аккаунт и фото девушки или мужчины в одежде. Качество раздевания ботом…

Hiber3D: создание метавселенных с помощью естественного языка

10 сентября 2023
Hiber3D creating metaverses with LLM

Hiber3D: создание метавселенных с помощью естественного языка

Компания Hiber, разрабатывающая инструменты для создания метавселенных, объявила об интеграции с Google PaLM. Обновление Hiber3D позволит пользователям создавать и модифицировать 3D-сцены c помощью запросов на естественном языке. С помощью no-code…

Audiocraft: open source библиотека для генерации музыки и звуков

4 августа 2023
audiocraft

Audiocraft: open source библиотека для генерации музыки и звуков

Audiocraft — это PyTorch-библиотека с открытым исходным кодом для генерации музыки и звуков из текста, предназначенная для исследований в области генерации аудио с использованием глубокого обучения. Разработчики предоставили код двух…

Нейросети, которые помогут улучшить качество фото: 8 бесплатных онлайн сервисов

2 августа 2023
ai photo enhancer

Нейросети, которые помогут улучшить качество фото: 8 бесплатных онлайн сервисов

Рассмотрим онлайн сервисы на основе нейросетей, которые улучшают качество фото бесплатно. Бесплатно можно обработать от 5 изображений всего до нескольких изображений каждый день. Если вы хотите бесплатно обрабатывать множество фотографий,…