Google Imagen: генерация фотореалистичных изображений по описанию

29 мая 2022

Google Imagen: генерация фотореалистичных изображений по описанию

Google представила Imagen — модель, трансформирующую текстовое описание в изображение c разрешением 1024×1024 пикселей. Imagen превзошла OpenAI DALL-E 2 по степени реалистичности изображений. Imagen является комбинацией языковых моделей-трансформеров, используемых для…

Deepmind представила универсальную модель Gato

28 мая 2022

Deepmind представила универсальную модель Gato

DeepMind представила кросс-модальную универсальную модель с 1.2 миллиардами параметров Gato. Gato может выполнять более 600 задач, таких как воспроизведение видеоигр, создание субтитров к изображениям и управление роботами. DeepMind обучила Gato…

Модель обучили выполнять кросс-модальный поиск действий

9 мая 2022

Модель обучили выполнять кросс-модальный поиск действий

В MIT разработали модель кросс-модального поиска действий в текстовом, аудио- и видеоконтенте. Модель позволяет определить, где в видео происходит определенное действие, и идентифицировать его. Алгоритм обучен представлять данные таким образом,…

Flamingo: мультимодальная модель DeepMind

9 мая 2022

Flamingo: мультимодальная модель DeepMind

Flamingo – мультимодальная модель DeepMind, генерирующая текстовое описание фото, видео и звуков. Модель превосходит предыдущие state-of-the-art модели в 16 задачах, а ее особенностью является возможность обучаться на нескольких примерах. Обычно…

Алгоритм MIT для беспилотников предсказывает траектории объектов

29 апреля 2022

Алгоритм MIT для беспилотников предсказывает траектории объектов

Исследователи MIT разработали алгоритм для повышения безопасности беспилотных автомобилей. Модель предсказывает траектории передвигающихся рядом с беспилотником участников дорожного движения в реальном времени. Современные методы анализа дорожного движения либо слишком упрощены…

DALL-E 2: text-to-image модель OpenAI

13 апреля 2022

DALL-E 2: text-to-image модель OpenAI

OpenAI представила новую версию модели преобразования текста в изображение DALL-E. По сравнению с первой версией, DALL-E 2 генерирует изображения в более высоком качестве с меньшей задержкой, а также позволяет редактировать…

PaLM: языковая модель Google с 540 миллиардами параметров

8 апреля 2022

PaLM: языковая модель Google с 540 миллиардами параметров

Google представила PaLM – языковую модель с 540 миллиардами параметров. PaLM превзошла существующие языковые модели в большинстве бенчмарков. Модель обучена с использованием 6144 тензорных процессоров Google TPU на платформе параллельных…

Хирургический робот определяет место введения иглы

24 марта 2022

Хирургический робот определяет место введения иглы

AI-Guide – разработанный в MIT ручной хирургический робот, позволяющий автоматизировать процесс введения иглы или катетера в кровеносный сосуд. Устройство нацелено на оказание быстрой помощи в экстренных ситуациях. После несчастного случая…

Обучение с подкреплением для контроля термоядерных реакций

17 февраля 2022

Обучение с подкреплением для контроля термоядерных реакций

DeepMind объявила о применении обучения с подкреплением для управления состоянием плазмы в ходе термоядерной реакции. Алгоритм DeepMind позволил повысить стабильность процесса управляемого термоядерного синтеза на токамаке. Ядерный синтез — многообещающий…

Equidock: предсказание белковых комплексов

8 февраля 2022

Equidock: предсказание белковых комплексов

В MIT разработали нейросеть Equidock, предсказывающую соединение двух белков. Модель может ускорить разработку лекарств в 500 раз. Вырабатываемые иммунной системой белки — антитела — могут соединяться с вирусом для его нейтрализации.…

В Google AI обучили робота выполнять новые для него задания

5 февраля 2022

В Google AI обучили робота выполнять новые для него задания

В исследовании Google AI продемонстрирована возможность обучения роботов выполнению задач, отсутствовавших в обучающем датасете.  Метод позволяет ускорить и упростить процесс обучения роботов. Роботы в реальном мире неизбежно столкнутся с новыми…

Модель обучили находить оптимальную схему лечения

4 февраля 2022

Модель обучили находить оптимальную схему лечения

Microsoft разработала алгоритм обучения с подкреплением, предлагающий для текущего состояния пациента наиболее эффективную тактику лечения. Модель нацелена на ускорение принятия решений в здравоохранении в условиях ограниченного количества медицинских данных. Модель…

В OpenAI обучили модель доказывать теоремы

4 февраля 2022

В OpenAI обучили модель доказывать теоремы

OpenAI представила нейросеть, доказывающую теоремы. Модель достигла точности 41% на miniF2F — датасете школьных олимпиадных задач. Для поиска доказательств используется языковая модель, обученная по принципу обучения школьников: каждый раз, когда…

AlphaCode: модель генерации кода по описанию DeepMind

3 февраля 2022

AlphaCode: модель генерации кода по описанию DeepMind

DeepMind представила систему генерации кода AlphaCode с 41 миллиардом параметров. AlphaCode превосходит OpenAI Codex и генерирует код на 12 языках. Согласно исследованию Кембриджского университета, более половины рабочего времени разработчиков тратится…

Нейросеть обучили высокоточно отделять объект от фона

25 января 2022

Нейросеть обучили высокоточно отделять объект от фона

В Google разработали нейросеть, с высокой точностью отделяющую объект от фона на изображении. Модель используется в портретном режиме съемки на Pixel 6. При классической сегментации изображения каждый пиксель относится либо…

HyperStyle: фотореалистичное редактирование изображений

24 января 2022

HyperStyle: фотореалистичное редактирование изображений

HyperStyle — нейросеть, модифицирующая отдельные параметры объектов на фотографиях. C помощью HyperStyle можно изменить прическу человека или цвет машины. Нейросеть, обученная на изображениях объектов одного типа, позволяет практически в реальном времени…

Разработан робот, управляемый мозгом пациента

7 января 2022

Разработан робот, управляемый мозгом пациента

Исследователи из Федеральной политехнической школы Лозанны разработали робота, управляемого на основе электрических сигналов, поступающих от мозга. Таким роботом смогут пользоваться люди с параличом. Разработка робота была нацелена на помощь людям…

GLIDE: модель OpenAI генерации изображений по тексту

27 декабря 2021

GLIDE: модель OpenAI генерации изображений по тексту

GLIDE — модель OpenAI генерации изображения по его описанию. GLIDE превосходит DALL-E и при этом имеет в 3 раза меньше параметров. В январе 2021-го года OpenAI представила DALL-E, версию с…

В OpenAI обучили модель искать ответы на вопросы в Интернете

19 декабря 2021

В OpenAI обучили модель искать ответы на вопросы в Интернете

OpenAI представила WebGPT — модель, выполняющую поиск ответа на вопрос в Интернете. WebGPT комбинирует информацию из нескольких источников и генерирует текст ответа. Языковые модели, такие как GPT-3, полезны для многих…

Uni-TTSv4: модель Microsoft, преобразовывающая текст в речь

19 декабря 2021

Uni-TTSv4: модель Microsoft, преобразовывающая текст в речь

Microsoft представила обновление Uni-TTS — модели, преобразовывающую текст в речь. Uni-TTSv4 обеспечивает наилучшее качество речи среди аналогичных state-of-the-art моделей и в ближайшее время будет доступна в Azure более чем на…

RETRO: языковая модель DeepMind

10 декабря 2021

RETRO: языковая модель DeepMind

DeepMind представила языковую модель RETRO, в которой реализована схема обучения, основанная на использовании внешней памяти. RETRO демонстрирует сравнимые с GPT-3 результаты несмотря на то, что она имеет в 25 раз…