ArtAug: мультиагентный открытый фреймворк для улучшения генерации изображений

18 декабря 2024
Enhancing Text-to-Image Generation

ArtAug: мультиагентный открытый фреймворк для улучшения генерации изображений

Исследователи Alibaba Group представили фреймворк ArtAug для улучшения качества генерации изображений из текста без дополнительных вычислительных затрат на этапе инференса, используя взаимодействие между генеративными и понимающими (understanding) моделями. Архитектура ArtAug…

Sora Turbo: состоялся публичный релиз новой модели OpenAI для создания видео

10 декабря 2024
SORA AI video generation model goes public

Sora Turbo: состоялся публичный релиз новой модели OpenAI для создания видео

OpenAI объявила о публичном релизе Sora Turbo, значительно улучшенной версии своей гиперреалистичной text-to-video, image-to-video и video-to-video модели. Презентация прошла на конференции «12 дней OpenAI», спустя почти 10 месяцев после первой…

Vinteo AI — нейросеть, которая создает реалистичные визуализации товаров за 2 минуты

7 декабря 2024
Vinteo AI - нейросеть, которая создает реалистичные визуализации товаров за пару минут

Vinteo AI — нейросеть, которая создает реалистичные визуализации товаров за 2 минуты

Vinteo AI — SAAS на основе ИИ специализирующуюся на разработке решений в области искусственного интеллекта для визуальной презентации товаров. Нейросеть обеспечивает оперативное и экономически рациональное создание фотореалистичных изображений товаров в…

Создание игр на основе искусственного интеллекта: новый бесплатный курс от DeepLearning.AI

2 декабря 2024
deeplearning ai game development course free

Создание игр на основе искусственного интеллекта: новый бесплатный курс от DeepLearning.AI

DeepLearning.AI представил образовательный курс Building an AI-Powered Game. Программа курса фокусируется на практическом применении языковых моделей в разработке игр и предназначена для разработчиков разного уровня подготовки. Длительность курса — 1…

FinRobot: открытый мультиагентный фреймворк для анализа рынка акций

16 ноября 2024
finrobot model

FinRobot: открытый мультиагентный фреймворк для анализа рынка акций

Исследователи AI4Finance Foundation представили открытую модель FinRobot — фреймворк AI-агентов, специально разработанный для анализа рынка акций. FinRobot объединяет количественный и качественный анализ через трехуровневый подход Chain of Thought (CoT). Модель…

Mochi 1: открытая модель генерации видео от Genmo

23 октября 2024

Mochi 1: открытая модель генерации видео от Genmo

Mochi 1 — открытая модель генерации видео с архитектурой Asymmetric Diffusion Transformer (AsymmDiT) от Genmo AI. Mochi 1 содержит 10 миллиардов параметров, сокращая имеющийся разрыв в качестве между закрытыми и открытыми…

В Hailuo AI появилась возможность генерировать видео на основе изображения

9 октября 2024
hailuo image to video text to video

В Hailuo AI появилась возможность генерировать видео на основе изображения

Платформа для генерации видео Hailuo AI запустила новую функцию Image-to-Video, позволяющую преобразовывать статичные изображения в динамичные видеоролики. После своего релиза в сентябре 2024 года Hailuo AI, созданная китайским стартапом MiniMax,…

Состоялся релиз LLaMA 3.1: открытая модель превосходит GPT-4o и Claude Sonnet 3.5 на бенчмарках

24 июля 2024
llama 3.1 human evaluation

Состоялся релиз LLaMA 3.1: открытая модель превосходит GPT-4o и Claude Sonnet 3.5 на бенчмарках

Модели LLaMA 3.1 официально выпущены, включая самую большую открытую модель с 405 миллиардами параметрами, модели 70B и 8B и мультимодальную модель. Контекст расширен до 128K токенов, поддерживается восемь языков, а…

Как ИИ помог студии King разработать 13755 уровней для игры Candy Crush Saga

4 июля 2024
candy crush ai

Как ИИ помог студии King разработать 13755 уровней для игры Candy Crush Saga

Компания King, разработчик известной мобильной игры Candy Crush Saga, активно внедряет искусственный интеллект в процесс разработки и оптимизации игры. В недавнем интервью Сахар Асади (Sahar Asadi) из AI Labs Activision…

Dream Machine от Luma AI — нейросеть для создания коротких видео из текста или изображения

14 июня 2024
dream machine luma ai

Dream Machine от Luma AI — нейросеть для создания коротких видео из текста или изображения

Dream Machine от Luma AI — это генеративная нейросеть, предназначенная для создания коротких видео на основе текстовых промтов и изображений. Dream Machine построена на масштабируемой трансформерной архитектуре, которая обучена на…

Apple представила «Apple Intelligence» и партнёрство с OpenAI на WWDC

11 июня 2024
Apple-WWDC24-Apple-Intelligence-OpenAI-deal

Apple представила «Apple Intelligence» и партнёрство с OpenAI на WWDC

На Всемирной конференции разработчиков (WWDC) компания Apple представила «Apple Intelligence» и объявила о стратегическом партнёрстве с OpenAI. Эти шаги демонстрируют стремление компании интегрировать искусственный интеллект в свои устройства, такие как iPhone, iPad…

Sound Effects: генерация звуков по описанию

3 июня 2024

Sound Effects: генерация звуков по описанию

Стартап ElevenLabs представил Sound Effects – платформу для генерации звуков и аудиосэмплов различного типа на основе текстового описания. Сервис позволяет создателям видео, игр и другого контента сократить время на самостоятельную…

GPT-4 обучили прогнозировать финансовые показатели лучше аналитиков

26 мая 2024
finance market analisys ai model

GPT-4 обучили прогнозировать финансовые показатели лучше аналитиков

Ученые из Чикагского университета продемонстрировали, что большие языковые модели могут проводить анализ финансовой отчетности компаний с точностью, превосходящей точность профессиональных аналитиков. Выводы исследования могут иметь последствия для развития отрасли финансового…

Google Veo: модель генерации и редактирования видео

19 мая 2024
google veo

Google Veo: модель генерации и редактирования видео

Google DeepMind представила генеративную модель Veo, создающую видео длительностью более 60 секунд в разрешении Full HD. Помимо текстовых запросов, модель может принимать на вход изображения и видеоролики. Ключевой особенностью VEO…

Mabl: генерация тестов для мобильных приложений

28 апреля 2024
mabl testing

Mabl: генерация тестов для мобильных приложений

Платформа автоматизации тестирования Mabl объявила о запуске AI-сервиса для тестирования мобильных приложений. C ее помощью разработчики могут за несколько минут создавать тесты для iOS- и Android-приложений, покрывающие все основные типы…

Google RecurrentGemma: компактная локальная языковая модель

14 апреля 2024
recurrentgemma пщщпду

Google RecurrentGemma: компактная локальная языковая модель

Google представила языковую модель RecurrentGemma, работающую локально на устройствах с ограниченными ресурсами, таких как смартфоны, персональные компьютеры и умные колонки. Новая архитектура Google значительно снижает требования к памяти и процессору,…

Gretel: крупнейший открытый Text-to-SQL датасет

7 апреля 2024
gretel dataset sql

Gretel: крупнейший открытый Text-to-SQL датасет

Стартап Gretel, специализирующийся на генерации высококачественных синтетических данных, объявил о создании крупнейшего открытого text-to-SQL датасета, нацеленного на ускорение развития no-code инструментов аналитики. Датасет содержит более 100 000 корректных синтетических образцов…

Voice Engine: синтез голоса от OpenAI

1 апреля 2024
voice engine openai

Voice Engine: синтез голоса от OpenAI

OpenAI представила Voice Engine — модель, выполняющую клонирование голоса по 15-секундной аудиозаписи. В компании среди пользователей модели указывают подкастеров, дикторов, авторов аудиокниг и рекламных роликов, стримеров и другие профессии. На текущий…

В Midjourney добавили функцию переноса персонажа на новое изображение

17 марта 2024
перенос персонажа

В Midjourney добавили функцию переноса персонажа на новое изображение

В сервисе генерации изображений Midjourney появилась возможность переноса персонажа на новое изображение путем указания в запросе ссылки на уже существующее с ним изображение. Функция позволит использовать сервис для создания новых…

Ученые впервые разработали лекарство с помощью генеративных моделей

10 марта 2024
искусственный интеллект разрабатывает лекарство

Ученые впервые разработали лекарство с помощью генеративных моделей

Стартап Insilico Medicine представил первое лекарство, разработанное с помощью генеративных моделей. Новый подход к созданию позволил препарату пройти первую фазы клинических испытаний всего за два года – втрое быстрее, чем…

Sora: диффузионная text-to-image модель OpenAI

18 февраля 2024
openai sora

Sora: диффузионная text-to-image модель OpenAI

OpenAI представила Sora – диффузионную text-to-image модель, генерирующую видео длительностью 60 секунд. Ключевые преимущества модели OpenAI по сравнению с решениями конкурентов (включая Runway, Pika, Stability AI и Google) – высокое…