Google AI / Нейросети и глубокое обучение

Google RecurrentGemma: компактная локальная языковая модель

14 апреля 2024

Google RecurrentGemma: компактная локальная языковая модель

Google представила языковую модель RecurrentGemma, работающую локально на устройствах с ограниченными ресурсами, таких как смартфоны, персональные компьютеры и умные колонки. Новая архитектура Google значительно снижает требования к памяти и процессору,…

SCIN: датасет изображений дерматологических заболеваний

25 марта 2024

SCIN: датасет изображений дерматологических заболеваний

Google вместе со Stanford Medicine представила SCIN – открытый датасет с 10 000 изображениями дерматологических заболеваний. Обученные на его основе модели смогут удаленно диагностировать аллергические, воспалительные и инфекционные состояния кожи,…

Google MobileDiffusion: генерация изображений на мобильных устройствах

4 февраля 2024

Google MobileDiffusion: генерация изображений на мобильных устройствах

Google представила MobileDiffusion – модель преобразования текста в изображение в реальном времени, полностью работающую на мобильных устройствах. На Android- и iOS-устройствах с процессорами последних поколений генерация изображения с разрешением 512×512…

VideoPoet: языковая модель Google для генерации и редактирования видео

23 декабря 2023

VideoPoet: языковая модель Google для генерации и редактирования видео

Google представила VideoPoet – языковую модель для мультимодальной работы с видеоконтентом, способную преобразовывать текст и изображение в ролики, стилизовать существующие видео и генерировать аудиодорожки к ним без подсказок. VideoPoet обучает…

Google MusicFX: создание музыки по текстовому запросу

17 декабря 2023

Google MusicFX: создание музыки по текстовому запросу

Google запустил MusicFX – онлайн-сервис для генерации музыки по текстовому запросу. В продукте используется модель Google MusicLM, а каждый аудиофайл содержит незаметный для слушателя водяной знак, сгенерированный с помощью DeepMind…

Google представила набор языковых моделей Gemini

7 декабря 2023

Google представила набор языковых моделей Gemini

Google сообщила о создании Gemini – набора из трех языковых моделей, превосходящих конкурентов в 30 из 32 бенчмарках. Старшая модель Gemini Ultra доступна через API, средняя Gemini Pro будет использоваться…

Google добавила в поиск генерацию изображений

15 октября 2023

Google добавила в поиск генерацию изображений

Google объявила о внедрении в поиск генерации изображений по описанию и ряда других AI-функций. Инструмент основан на модели Imagen и позволяет несколько раз уточнять запрос для получения требуемого результата. На…

Google VRDU: обучение моделей пониманию содержания документов

27 августа 2023

Google VRDU: обучение моделей пониманию содержания документов

Google опубликовала в открытом доступе VRDU – датасет и бенчмарк для обучения моделей пониманию содержания документов. VRDU нацелен на ускорение развития моделей, обрабатывающих сложные документы для повышения эффективности бизнес-процессов и…

Обновление Google Bard: работа с изображениями и поддержка новых языков

16 июля 2023

Обновление Google Bard: работа с изображениями и поддержка новых языков

Google Bard обновилась – теперь она работает на 46 языках в более чем 200 странах, включая страны Европы и Бразилию. Новые функции включают работу с изображениями, каталогизацию диалогов и управление…

Google Try-on: примерка одежды онлайн

18 июня 2023

Google Try-on: примерка одежды онлайн

Google представила Try-on – диффузионную модель, позволяющую пользователям сервиса «Покупки» примерить одежду на моделях с различным телосложением и оттенком кожи. Модель меняет одежду в один клик, фотореалистично воспроизводит драпировку, облегание,…

PaLM 2: новое поколение языковой модели Google

12 мая 2023

PaLM 2: новое поколение языковой модели Google

Google представила PaLM 2 – новую версию своей языковой модели, которая будет использоваться в более чем 25 продуктах и сервисах компании, таких как Bard, Workspace, Cloud, Security и Vertex AI.…

В Google AI обучили модель определять состояние организма по фото глаз

30 марта 2023

В Google AI обучили модель определять состояние организма по фото глаз

Google AI опубликовали исследование, показывающее, что дефицит или избыток ряда системных биомаркеров, охватывающих почки, кровь и печень, можно предсказать по фотографиям глаз. Точность метода превосходит точность стандартных моделей логистической регрессии,…

Google показала генератор текста Wordcraft на основе LaMDA на конференции в Нью-Йорке

5 ноября 2022

Google показала генератор текста Wordcraft на основе LaMDA на конференции в Нью-Йорке

13 профессиональных авторов тестировали языковую модель Google LaMDA (Language Model for Dialogue Applications) в течение нескольких месяцев. Результатом стала презентация Wordcraft — редактора текстов со встроенными рекомендациями, на конференции GoogleAI…

Google представил нейросеть для детекции туберкулеза на радиограммах

8 сентября 2022

Google представил нейросеть для детекции туберкулеза на радиограммах

Каждый год туберкулез убивает 1,4 миллиона человек по всему миру. Google присоединился к борьбе с болезнью, разработав нейронную сеть для автоматизации обнаружения и ускорения лечения туберкулеза. Применять ее планируется в…

Google Imagen генерирует фотореалистичные изображения по описанию

29 июня 2022

Google Imagen генерирует фотореалистичные изображения по описанию

Google Imagen — модель, трансформирующая текстовое описание в изображение c разрешением 1024×1024 пикселей. Imagen превзошла OpenAI DALL-E 2 по степени реалистичности изображений. Imagen является комбинацией языковых моделей-трансформеров, используемых для обработки…

GraphWorld: бенчмарк для графовых нейросетей

9 мая 2022

GraphWorld: бенчмарк для графовых нейросетей

Google AI представила бенчмарк для графовых нейросетей GraphWorld. Бенчмарк использует несколько миллионов синтетических датасетов, воспроизводящих широкий класс графов, и генерирует обобщенную оценку нейросети на основе ее тестирования на всех датасетах.…

Google Cloud Manufacturing: расширенная аналитика на производствах

9 мая 2022

Google Cloud Manufacturing: расширенная аналитика на производствах

Google и Ford разработали инструмент Google Cloud Manufacturing, нацеленный на объединение и унификацию разрозненных данных на производствах. Инструмент предоставляет возможность анализировать производственные процессы и обучать широкий класс моделей. Операции на…

PaLM: языковая модель Google с 540 миллиардами параметров

8 апреля 2022

PaLM: языковая модель Google с 540 миллиардами параметров

Google представила PaLM – языковую модель с 540 миллиардами параметров. PaLM превзошла существующие языковые модели в большинстве бенчмарков. Модель обучена с использованием 6144 тензорных процессоров Google TPU на платформе параллельных…

В Google AI обучили робота выполнять новые для него задания

5 февраля 2022

В Google AI обучили робота выполнять новые для него задания

В исследовании Google AI продемонстрирована возможность обучения роботов выполнению задач, отсутствовавших в обучающем датасете. Метод позволяет ускорить и упростить процесс обучения роботов. Роботы в реальном мире неизбежно столкнутся с новыми…

Приложение Google ищет похожих животных на картинах

26 декабря 2021

Приложение Google ищет похожих животных на картинах

Google добавила в iOS- и Android-приложение Google Arts & Culture функцию Pet Portraits. Pet Portraits выполняет поиск двойника животного на объектах искусства. Схожая функция была доступна с 2018-го года для…

Google тестирует приложение для людей с нарушениями речи

20 ноября 2021

Google тестирует приложение для людей с нарушениями речи

Google приглашает людей с нарушениями речи присоединиться к тестированию Android-приложения Project Relate. Приложение нацелено на упрощение общения людей с инсультом, БАС, болезнью Паркинсона и другими заболеваниями. Проект Relate стал возможным благодаря…