Google представила Gemini 2.5 Flash Image aka Nano Banana — новую модель генерации изображений

26 августа 2025
gemini flash image 2.5

Google представила Gemini 2.5 Flash Image aka Nano Banana — новую модель генерации изображений

Google представила Gemini 2.5 Flash Image (с внутренним кодовым названием nano-banana) — модель для генерации и редактирования изображений. Модель поддерживает комбинирование нескольких изображений в одно, сохраняет консистентность персонажей между генерациями,…

Gemini 2.5 Pro показала уровень золотого медалиста на Международной математической олимпиаде IMO 2025, решив 5 из 6 задач

25 июля 2025
Gemini 2.5 pro IMO 2025

Gemini 2.5 Pro показала уровень золотого медалиста на Международной математической олимпиаде IMO 2025, решив 5 из 6 задач

Большие языковые модели хорошо справляются с математическими бенчмарками вроде AIME, однако задачи Международной математической олимпиады (IMO) требуют глубокого понимания, креативности и формального рассуждения. Китайские исследователи использовали Google Gemini 2.5 Pro…

Google PH-LLM: языковая модель для мониторинга здоровья

16 июня 2024
Google PH-LLM pipeline

Google PH-LLM: языковая модель для мониторинга здоровья

Google разработала языковую модель PH-LLM для анализа медицинских данных, собранных с носимых устройств – умных часов и пульсометров. В ходе экспериментов модель отвечала на вопросы о здоровье и прогнозировала состояние…

Google Veo: модель генерации и редактирования видео

19 мая 2024
google veo

Google Veo: модель генерации и редактирования видео

Google DeepMind представила генеративную модель Veo, создающую видео длительностью более 60 секунд в разрешении Full HD. Помимо текстовых запросов, модель может принимать на вход изображения и видеоролики. Ключевой особенностью VEO…

Google Gecko: бенчмарк для text-to-image моделей

6 мая 2024
Google Gecko

Google Gecko: бенчмарк для text-to-image моделей

Google DeepMind разработала Gecko – бенчмарк, обеспечивающий более точное и надежное тестирование и сравнение text-to-image моделей, чем существующие подходы. Исследование Google DeepMind выявило скрытые ограничения в том, как в настоящее…

SCIN: датасет изображений дерматологических заболеваний

25 марта 2024
google scin dataset

SCIN: датасет изображений дерматологических заболеваний

Google вместе со Stanford Medicine представила SCIN – открытый датасет с 10 000 изображениями дерматологических заболеваний. Обученные на его основе модели смогут удаленно диагностировать аллергические, воспалительные и инфекционные состояния кожи,…

Google MobileDiffusion: генерация изображений на мобильных устройствах

4 февраля 2024
MobileDiffusion

Google MobileDiffusion: генерация изображений на мобильных устройствах

Google представила MobileDiffusion – модель преобразования текста в изображение в реальном времени, полностью работающую на мобильных устройствах. На Android- и iOS-устройствах с процессорами последних поколений генерация изображения с разрешением 512×512…

VideoPoet: языковая модель Google для генерации и редактирования видео

23 декабря 2023
videopoet

VideoPoet: языковая модель Google для генерации и редактирования видео

Google представила VideoPoet – языковую модель для мультимодальной работы с видеоконтентом, способную преобразовывать текст и изображение в ролики, стилизовать существующие видео и генерировать аудиодорожки к ним без подсказок. VideoPoet обучает…

Google MusicFX: создание музыки по текстовому запросу

17 декабря 2023

Google MusicFX: создание музыки по текстовому запросу

Google запустил MusicFX – онлайн-сервис для генерации музыки по текстовому запросу. В продукте используется модель Google MusicLM, а каждый аудиофайл содержит незаметный для слушателя водяной знак, сгенерированный с помощью DeepMind…

Google представила набор языковых моделей Gemini

7 декабря 2023

Google представила набор языковых моделей Gemini

Google сообщила о создании Gemini – набора из трех языковых моделей, превосходящих конкурентов в 30 из 32 бенчмарках. Старшая модель Gemini Ultra доступна через API, средняя Gemini Pro будет использоваться…

Google добавила в поиск генерацию изображений

15 октября 2023
google generative search

Google добавила в поиск генерацию изображений

Google объявила о внедрении в поиск генерации изображений по описанию и ряда других AI-функций. Инструмент основан на модели Imagen и позволяет несколько раз уточнять запрос для получения требуемого результата. На…

В чат-бота Bard добавили интеграцию с сервисами Google

19 сентября 2023
bard_with_google_services

В чат-бота Bard добавили интеграцию с сервисами Google

Google представил обновление чат-бота Bard, в котором появилась интеграция с сервисами компании — почтой, документами, таблицами, картами, Youtube. В качестве персонального помощника Bard получил конкурентное преимущество перед ChatGPT, который умеет…

Hiber3D: создание метавселенных с помощью естественного языка

10 сентября 2023
Hiber3D creating metaverses with LLM

Hiber3D: создание метавселенных с помощью естественного языка

Компания Hiber, разрабатывающая инструменты для создания метавселенных, объявила об интеграции с Google PaLM. Обновление Hiber3D позволит пользователям создавать и модифицировать 3D-сцены c помощью запросов на естественном языке. С помощью no-code…

Google VRDU: обучение моделей пониманию содержания документов

27 августа 2023
google vrdu 2

Google VRDU: обучение моделей пониманию содержания документов

Google опубликовала в открытом доступе VRDU – датасет и бенчмарк для обучения моделей пониманию содержания документов. VRDU нацелен на ускорение развития моделей, обрабатывающих сложные документы для повышения эффективности бизнес-процессов и…

Обновление Google Bard: работа с изображениями и поддержка новых языков

16 июля 2023
google bard

Обновление Google Bard: работа с изображениями и поддержка новых языков

Google Bard обновилась – теперь она работает на 46 языках в более чем 200 странах, включая страны Европы и Бразилию. Новые функции включают работу с изображениями, каталогизацию диалогов и управление…

MAGVIT: open source генеративный видео-трансформер 10 в 1

29 июня 2023
MAGVIT

MAGVIT: open source генеративный видео-трансформер 10 в 1

Исследователи из института Карнеги-Меллон, Google Research и Университета Джорджии представили open source модель генерации видео MAGVIT (Masked Generative Video Transformer). Единая модель MAGVIT способна улучшать FPS, экстраполировать кадры, создавать видео…

Google Try-on: примерка одежды онлайн

18 июня 2023
нейросеть одежда

Google Try-on: примерка одежды онлайн

Google представила Try-on – диффузионную модель, позволяющую пользователям сервиса «Покупки» примерить одежду на моделях с различным телосложением и оттенком кожи. Модель меняет одежду в один клик,  фотореалистично воспроизводит драпировку, облегание,…

Модель от Google Health впервые будет внедрена в клиническую практику в результате сделки с iCAD

1 декабря 2022
icad google health deal

Модель от Google Health впервые будет внедрена в клиническую практику в результате сделки с iCAD

Google Health продала лицензию на свои AI-модели для обнаружения рака молочной железы и анализа маммографий медицинской компании iCAD, которая интегрирует их в свои инструменты визуализации. Это первый случай, когда модель…

Google Cloud Manufacturing: расширенная аналитика на производствах

9 мая 2022
Google Cloud Manufacturing

Google Cloud Manufacturing: расширенная аналитика на производствах

Google и Ford разработали инструмент Google Cloud Manufacturing, нацеленный на объединение и унификацию разрозненных данных на производствах. Инструмент предоставляет возможность анализировать производственные процессы и обучать широкий класс моделей. Операции на…

Нейросеть обучили высокоточно отделять объект от фона

25 января 2022

Нейросеть обучили высокоточно отделять объект от фона

В Google разработали нейросеть, с высокой точностью отделяющую объект от фона на изображении. Модель используется в портретном режиме съемки на Pixel 6. При классической сегментации изображения каждый пиксель относится либо…

StylEx: выделение ключевых атрибутов классификаторов

21 января 2022
выделение атрибутов модели stylex

StylEx: выделение ключевых атрибутов классификаторов

Google представила StylEx — инструмент для выделения атрибутов модели, влияющих на классификаторы изображений. StylEx позволяет объяснить процесс принятия решения классификатором и находить ошибки в моделях. Определение того, какие признаки на…