Google добавила в поиск генерацию изображений

15 октября 2023
google generative search

Google добавила в поиск генерацию изображений

Google объявила о внедрении в поиск генерации изображений по описанию и ряда других AI-функций. Инструмент основан на модели Imagen и позволяет несколько раз уточнять запрос для получения требуемого результата. На…

В чат-бота Bard добавили интеграцию с сервисами Google

19 сентября 2023
bard_with_google_services

В чат-бота Bard добавили интеграцию с сервисами Google

Google представил обновление чат-бота Bard, в котором появилась интеграция с сервисами компании — почтой, документами, таблицами, картами, Youtube. В качестве персонального помощника Bard получил конкурентное преимущество перед ChatGPT, который умеет…

Hiber3D: создание метавселенных с помощью естественного языка

10 сентября 2023
Hiber3D creating metaverses with LLM

Hiber3D: создание метавселенных с помощью естественного языка

Компания Hiber, разрабатывающая инструменты для создания метавселенных, объявила об интеграции с Google PaLM. Обновление Hiber3D позволит пользователям создавать и модифицировать 3D-сцены c помощью запросов на естественном языке. С помощью no-code…

Google VRDU: обучение моделей пониманию содержания документов

27 августа 2023
google vrdu 2

Google VRDU: обучение моделей пониманию содержания документов

Google опубликовала в открытом доступе VRDU – датасет и бенчмарк для обучения моделей пониманию содержания документов. VRDU нацелен на ускорение развития моделей, обрабатывающих сложные документы для повышения эффективности бизнес-процессов и…

Обновление Google Bard: работа с изображениями и поддержка новых языков

16 июля 2023
google bard

Обновление Google Bard: работа с изображениями и поддержка новых языков

Google Bard обновилась – теперь она работает на 46 языках в более чем 200 странах, включая страны Европы и Бразилию. Новые функции включают работу с изображениями, каталогизацию диалогов и управление…

MAGVIT: open source генеративный видео-трансформер 10 в 1

29 июня 2023
MAGVIT

MAGVIT: open source генеративный видео-трансформер 10 в 1

Исследователи из института Карнеги-Меллон, Google Research и Университета Джорджии представили open source модель генерации видео MAGVIT (Masked Generative Video Transformer). Единая модель MAGVIT способна улучшать FPS, экстраполировать кадры, создавать видео…

Google Try-on: примерка одежды онлайн

18 июня 2023
нейросеть одежда

Google Try-on: примерка одежды онлайн

Google представила Try-on – диффузионную модель, позволяющую пользователям сервиса «Покупки» примерить одежду на моделях с различным телосложением и оттенком кожи. Модель меняет одежду в один клик,  фотореалистично воспроизводит драпировку, облегание,…

Модель от Google Health впервые будет внедрена в клиническую практику в результате сделки с iCAD

1 декабря 2022
icad google health deal

Модель от Google Health впервые будет внедрена в клиническую практику в результате сделки с iCAD

Google Health продала лицензию на свои AI-модели для обнаружения рака молочной железы и анализа маммографий медицинской компании iCAD, которая интегрирует их в свои инструменты визуализации. Это первый случай, когда модель…

Нейросеть обучили высокоточно отделять объект от фона

25 января 2022

Нейросеть обучили высокоточно отделять объект от фона

В Google разработали нейросеть, с высокой точностью отделяющую объект от фона на изображении. Модель используется в портретном режиме съемки на Pixel 6. При классической сегментации изображения каждый пиксель относится либо…

StylEx: выделение ключевых атрибутов классификаторов

21 января 2022
выделение атрибутов модели stylex

StylEx: выделение ключевых атрибутов классификаторов

Google представила StylEx — инструмент для выделения атрибутов модели, влияющих на классификаторы изображений. StylEx позволяет объяснить процесс принятия решения классификатором и находить ошибки в моделях. Определение того, какие признаки на…

Samsung использует искусственный интеллект для разработки чипов

19 августа 2021

Samsung использует искусственный интеллект для разработки чипов

Samsung использует систему искусственного интеллекта DSO.ai компании Synopsys для разработки нового поколения ARM-микропроцессоров Exynos, используемых в смартфонах компании. В Synopsys заявляют, что метод обучения с подкреплением позволяет более чем в…

5 облачных сервисов для обработки видео нейросетями

14 июля 2021
обработка видео нейросетью

5 облачных сервисов для обработки видео нейросетями

Методы компьютерного зрения позволяют распознавать лица на видеозаписях, классифицировать и улучшать качество видео, а также автоматически создавать аннотации к ним. В статье приводится обзор основных облачных платформ для обработки видео…

Нейросеть от Google AI симулирует движение камеры

3 марта 2021

Нейросеть от Google AI симулирует движение камеры

Нейросеть от Google AI симулирует движение камеры и параллакс для фотографий. Систему Cinematic photos используют в приложении Google Photos. Оценка глубины изображения Наряду с такими последними функциями для фотографии, как…

Google открыли фреймворк для автоматического поиска архитектуры ML-моделей

23 февраля 2021

Google открыли фреймворк для автоматического поиска архитектуры ML-моделей

Model search (MS) — это библиотека, которая использует алгоритмы автоматического поиска архитектуры ML-моделей. Разработчики заявляют, что фреймворк масштабируется на кейсы, когда пространство поиска является немалым. Фреймворк базируется на байесовской оптимизации.…

TracIn: способ оценить влияние отдельных объектов в данных на предсказания

10 февраля 2021

TracIn: способ оценить влияние отдельных объектов в данных на предсказания

TracIn — это масштабируемый метод оценки влияния отдельных объектов в данных на предсказания. Идея TracIn заключается в том, что бы отслеживать процесс обучения модели, чтобы засекать изменения в предсказаниях при…

Google опубликовали датасет с фейковыми видео

1 октября 2019

Google опубликовали датасет с фейковыми видео

FaceForensics — это датасет с фейковыми видео людей, который был дополнен Google. Датасет выложили, чтобы поддержать исследования в распознавании deepfake контента. Данные содержат 3 тысячи сгенерированных видеозаписей. Датасет собирался в…

ALBERT: разработчики из Google оптимизировали размер BERT

30 сентября 2019
google logo

ALBERT: разработчики из Google оптимизировали размер BERT

A LITE BERT (ALBERT) — это оптимизированная версия BERT от Google. Разработчики использовали два метода для снижения количества параметров нейросети: параметризация векторных представлений и обмен весов между слоями нейросети. По…

Из чего состоит рекомендательная система YouTube

24 сентября 2019

Из чего состоит рекомендательная система YouTube

Разработчики из Google опубликовали описание end-to-end рекомендательной системы в YouTube. Система использует несколько целевых функций для ранжирования и учитывает личные предпочтения пользователя. Чтобы оптимизировать модель на несколько целевых функций разработчики…

Нейросеть реконструирует модель объекта в 3D из изображения

23 сентября 2019

Нейросеть реконструирует модель объекта в 3D из изображения

Исследователи из Google опубликовали self-supervised алгоритм, который реконструирует 3D модель объекта из изображения. Нейросеть разбивает объект с изображения на составные фигуры и объединяет их в 3D модель объекта.  CvxNets разбивают…

Google открыли разработку компилятора для ML-моделей

10 сентября 2019

Google открыли разработку компилятора для ML-моделей

Google отдают разработку инфраструктуры для обучения ML-моделей организации open-source разработчиков LLVM Foundation. Ранее Google анонсировали MLIR, компилятор для внедрения ML-моделей в приложения. MLIR позволяет исполнять модели на разных устройствах. Компания…

В Google Lens теперь можно прослушивать текст с изображения

6 сентября 2019

В Google Lens теперь можно прослушивать текст с изображения

В приложении Google Lens теперь есть функция прослушивания и перевода текста с изображения. Система сначала распознает куски текста на изображении, формирует структурированный текст из кусков, переводит текст и озвучивает перевод.…