Sora: диффузионная text-to-image модель OpenAI

18 февраля 2024
openai sora

Sora: диффузионная text-to-image модель OpenAI

OpenAI представила Sora – диффузионную text-to-image модель, генерирующую видео длительностью 60 секунд. Ключевые преимущества модели OpenAI по сравнению с решениями конкурентов (включая Runway, Pika, Stability AI и Google) – высокое…

Google MobileDiffusion: генерация изображений на мобильных устройствах

4 февраля 2024
MobileDiffusion

Google MobileDiffusion: генерация изображений на мобильных устройствах

Google представила MobileDiffusion – модель преобразования текста в изображение в реальном времени, полностью работающую на мобильных устройствах. На Android- и iOS-устройствах с процессорами последних поколений генерация изображения с разрешением 512×512…

You.com обучили отвечать на многоэтапные поисковые запросы

28 января 2024

You.com обучили отвечать на многоэтапные поисковые запросы

В поисковый сервис You.com, предоставляющий персонализированные ответы с помощью языковых моделей, добавили три новых режима – Genius, Create и Research. В данных режимах сервис выдает ответ в виде сгенерированных изображений…

Pika 1.0: веб-платформа для генерации видео

7 января 2024
pika

Pika 1.0: веб-платформа для генерации видео

Стартап Pika Labs запустил Pika 1.0 – бесплатную веб-платформу для генерации и редактирования видео с помощью текстовых запросов. Сервис создает как реалистичные видео, так и 3D-анимацию в различных стилях. При…

Google MusicFX: создание музыки по текстовому запросу

17 декабря 2023

Google MusicFX: создание музыки по текстовому запросу

Google запустил MusicFX – онлайн-сервис для генерации музыки по текстовому запросу. В продукте используется модель Google MusicLM, а каждый аудиофайл содержит незаметный для слушателя водяной знак, сгенерированный с помощью DeepMind…

Microsoft LeMa: обучение языковых моделей на их ошибках

4 ноября 2023
Microsoft LeMa

Microsoft LeMa: обучение языковых моделей на их ошибках

Исследователи Microsoft представили LeMa (Learning from Mistakes) – алгоритм с открытым исходным кодом для улучшения способности больших языковых моделей решать математические задачи. LeMa заставляет модель учиться на своих ошибках, имитируя…

В Shutterstock добавили редактирование изображений на основе DALL-E 2

28 октября 2023

В Shutterstock добавили редактирование изображений на основе DALL-E 2

В хранилище стоковых изображений Shutterstock добавили возможность обработки изображений перед скачиванием c помощью текстовых запросов. Новые функции работают на основе OpenAI DALL-E 2 и позволяют менять угол обзора сцены, заменять…

NVIDIA Eureka: агент для автономного обучения роботов

22 октября 2023

NVIDIA Eureka: агент для автономного обучения роботов

NVIDIA представила Eureka – агента на базе GPT-4 c открытым исходным кодом, обучающего роботов сложным навыкам, таким как выполнение трюков и работу с ножницами. Большие языковые модели ранее уже показали…

Google добавила в поиск генерацию изображений

15 октября 2023
google generative search

Google добавила в поиск генерацию изображений

Google объявила о внедрении в поиск генерации изображений по описанию и ряда других AI-функций. Инструмент основан на модели Imagen и позволяет несколько раз уточнять запрос для получения требуемого результата. На…

Microsoft AutoGen: фреймворк для настройки LLM-агентов

8 октября 2023
AutoGen framework

Microsoft AutoGen: фреймворк для настройки LLM-агентов

Microsoft представила AutoGen, open-source библиотеку для создания и настройки LLM-агентов – отдельных сеансов больших языковых моделей, которые могут взаимодействовать друг с другом для совместного решения задач. LLM-агенты – перспективная область…

Microsoft Copilot и другие 150 AI-функций Windows 11

1 октября 2023
copilot

Microsoft Copilot и другие 150 AI-функций Windows 11

Microsoft выпустила обновление Windows 11, включающее более 150 AI-функций и чат-бота Copilot, поддерживающего большинство приложений операционной системы. Copilot является единой точкой входа для взаимодействия с приложениями и контентом с помощью…

ChatGPT научился вести диалог голосом и распознавать объекты на изображениях

25 сентября 2023
ChatGPT conversations and image recognition

ChatGPT научился вести диалог голосом и распознавать объекты на изображениях

В ChatGPT внедрили функции общения голосом и распознавания объектов на изображении для углубленного погружения в задачу. Например, ChatGPT готов будет прочитать сказку на ночь, поможет справится с составлением рецепта по…

Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT

20 сентября 2023
Dalle-3

Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT

OpenAI объявила о выходе Dall-E 3 в интерфейсе ChatGPT в начале октября. В анонсе исследователи рассказали, что новая версия нейросети для генерации изображений значительно превосходит Dall-E-2 по нескольким критериям. Dall-E…

В чат-бота Bard добавили интеграцию с сервисами Google

19 сентября 2023
bard_with_google_services

В чат-бота Bard добавили интеграцию с сервисами Google

Google представил обновление чат-бота Bard, в котором появилась интеграция с сервисами компании — почтой, документами, таблицами, картами, Youtube. В качестве персонального помощника Bard получил конкурентное преимущество перед ChatGPT, который умеет…

Hiber3D: создание метавселенных с помощью естественного языка

10 сентября 2023
Hiber3D creating metaverses with LLM

Hiber3D: создание метавселенных с помощью естественного языка

Компания Hiber, разрабатывающая инструменты для создания метавселенных, объявила об интеграции с Google PaLM. Обновление Hiber3D позволит пользователям создавать и модифицировать 3D-сцены c помощью запросов на естественном языке. С помощью no-code…

OpenAI предложила учителям использовать ChatGPT для подготовки к урокам и проверки изученного материала

5 сентября 2023
chatgpt for teachers

OpenAI предложила учителям использовать ChatGPT для подготовки к урокам и проверки изученного материала

OpenAI в преддверии нового учебного года рассказала, как учителя могут использовать ChatGPT для автоматизации процесса обучения. В статье «Teaching with AI» компания предложила 4 конкретных промпта-инструкции, которые можно использовать учителям…

PhotoGuard: защита изображений от изменения генеративным моделями

5 сентября 2023
photoguard

PhotoGuard: защита изображений от изменения генеративным моделями

Исследователи MIT представили PhotoGuard – алгоритм защиты изображений от несанкционированных изменений генеративными моделями, позволяющий гарантировать подлинность изображений. Широкое распространение генеративных моделей (таких, как DALL-E и Midjourney) сделало простым даже для…

OpenAI открыла возможность дообучать модель GPT-3.5 Turbo для конкретных задач

22 августа 2023
GPT 3.5 turbo finetuning

OpenAI открыла возможность дообучать модель GPT-3.5 Turbo для конкретных задач

GPT-3.5 Turbo от OpenAI получил обновление, позволяющее разработчикам дообучать модель для использования в своих приложениях, что позволит разработчикам возможность максимально раскрыть потенциал GPT-3.5. Теперь разработчики могут делать тонкую настройку (finetuning)…

Arthur Bench: фреймворк для оценки языковых моделей

20 августа 2023
arthur bench

Arthur Bench: фреймворк для оценки языковых моделей

Американский стартап Arthur опубликовал в открытом доступе фреймворк Bench для оценки и сравнения производительности больших языковых моделей. Инструмент позволит пользователям выбрать языковую модель, наиболее подходящую для решения конкретной задачи, укажет…

Stability AI представила модель Stable Diffusion SDXL 1.0

26 июля 2023
Stable Diffusion SDXL 1.0

Stability AI представила модель Stable Diffusion SDXL 1.0

Компания Stability AI сегодня объявила о выпуске Stable Diffusion 1.0 XL, новой версии популярной модели для генерации изображений. SDXL 1.0 представляет собой базовую модель с 3,5 миллиарда параметров и пайплайн…

Проект «Закона об искусственном интеллекте» принят в Европарламенте. Что ждет разработчиков?

28 июня 2023
закон об искуственном интеллекте в ЕС

Проект «Закона об искусственном интеллекте» принят в Европарламенте. Что ждет разработчиков?

Европейский союз завершает работу над «Законом об искусственном интеллекте» (AI Act), который станет первым в мире всесторонним нормативным актом, регулирующим использование ИИ. Европейский парламент принял проект закона большинством голосов: 499…