GPT-4: OpenAI выпустила мультимодальную версию GPT

15 марта 2023

GPT-4: OpenAI выпустила мультимодальную версию GPT

OpenAI сообщила о создании GPT-4 – обновленной версии GPT-3.5, способной принимать на вход изображения и сдающей экзамены лучше 90% студентов. Модель уже доступна для использования подписчикам ChatGPT Plus и интегрирована…

Point-E: метод для создания облаков точек по текстовым подсказкам от OpenAI

21 декабря 2022
point-e openai

Point-E: метод для создания облаков точек по текстовым подсказкам от OpenAI

Исследователи OpenAI опубликовали новую модель для генерации 3D-объектов POINT-E, с помощью которой облака точек создаются на основе текстовых подсказок. Новый метод не превосходит state-of-the-art модели с точки зрения качества создаваемых…

Nvidia представила генератор 3D-модели по текстовому описанию Magic3D

23 ноября 2022
Magic3D model by Nvidia

Nvidia представила генератор 3D-модели по текстовому описанию Magic3D

Исследователи из Nvidia 18 ноября представили Magic3D — генератор 3D-модели по текстовому описанию. После ввода текстовой подсказки, например «Синяя ядовитая лягушка, сидящая на кувшинке», Magic3D создает 3D модель с цветной…

Стартап HuggingFace подсчитал, сколько тонн углекислого газа выделяется при создании LLM моделей

21 ноября 2022
LLM Carbon footprint

Стартап HuggingFace подсчитал, сколько тонн углекислого газа выделяется при создании LLM моделей

У больших языковых моделей (LLM) есть «грязный секрет»: до сих пор остается загадкой, насколько велик углеродный след этих моделей. AI-стартап Hugging Face разработал способ оценки выбросов, производимых в течение всего…

Google Imagen: генерация фотореалистичных изображений по описанию

29 июня 2022

Google Imagen: генерация фотореалистичных изображений по описанию

Google представила Imagen — модель, трансформирующую текстовое описание в изображение c разрешением 1024×1024 пикселей. Imagen превзошла OpenAI DALL-E 2 по степени реалистичности изображений. Imagen является комбинацией языковых моделей-трансформеров, используемых для…

Deepmind представила универсальную модель Gato

28 мая 2022

Deepmind представила универсальную модель Gato

DeepMind представила кросс-модальную универсальную модель с 1.2 миллиардами параметров Gato. Gato может выполнять более 600 задач, таких как воспроизведение видеоигр, создание субтитров к изображениям и управление роботами. DeepMind обучила Gato…

Модель обучили выполнять кросс-модальный поиск действий

9 мая 2022

Модель обучили выполнять кросс-модальный поиск действий

В MIT разработали модель кросс-модального поиска действий в текстовом, аудио- и видеоконтенте. Модель позволяет определить, где в видео происходит определенное действие, и идентифицировать его. Алгоритм обучен представлять данные таким образом,…

Flamingo: мультимодальная модель DeepMind

9 мая 2022

Flamingo: мультимодальная модель DeepMind

Flamingo – мультимодальная модель DeepMind, генерирующая текстовое описание фото, видео и звуков. Модель превосходит предыдущие state-of-the-art модели в 16 задачах, а ее особенностью является возможность обучаться на нескольких примерах. Обычно…

Алгоритм MIT для беспилотников предсказывает траектории объектов

29 апреля 2022

Алгоритм MIT для беспилотников предсказывает траектории объектов

Исследователи MIT разработали алгоритм для повышения безопасности беспилотных автомобилей. Модель предсказывает траектории передвигающихся рядом с беспилотником участников дорожного движения в реальном времени. Современные методы анализа дорожного движения либо слишком упрощены…

DALL-E 2: text-to-image модель OpenAI

13 апреля 2022

DALL-E 2: text-to-image модель OpenAI

OpenAI представила новую версию модели преобразования текста в изображение DALL-E. По сравнению с первой версией, DALL-E 2 генерирует изображения в более высоком качестве с меньшей задержкой, а также позволяет редактировать…

PaLM: языковая модель Google с 540 миллиардами параметров

8 апреля 2022

PaLM: языковая модель Google с 540 миллиардами параметров

Google представила PaLM – языковую модель с 540 миллиардами параметров. PaLM превзошла существующие языковые модели в большинстве бенчмарков. Модель обучена с использованием 6144 тензорных процессоров Google TPU на платформе параллельных…

Хирургический робот определяет место введения иглы

24 марта 2022

Хирургический робот определяет место введения иглы

AI-Guide – разработанный в MIT ручной хирургический робот, позволяющий автоматизировать процесс введения иглы или катетера в кровеносный сосуд. Устройство нацелено на оказание быстрой помощи в экстренных ситуациях. После несчастного случая…

Обучение с подкреплением для контроля термоядерных реакций

17 февраля 2022

Обучение с подкреплением для контроля термоядерных реакций

DeepMind объявила о применении обучения с подкреплением для управления состоянием плазмы в ходе термоядерной реакции. Алгоритм DeepMind позволил повысить стабильность процесса управляемого термоядерного синтеза на токамаке. Ядерный синтез — многообещающий…

Equidock: предсказание белковых комплексов

8 февраля 2022

Equidock: предсказание белковых комплексов

В MIT разработали нейросеть Equidock, предсказывающую соединение двух белков. Модель может ускорить разработку лекарств в 500 раз. Вырабатываемые иммунной системой белки — антитела — могут соединяться с вирусом для его нейтрализации.…

В Google AI обучили робота выполнять новые для него задания

5 февраля 2022

В Google AI обучили робота выполнять новые для него задания

В исследовании Google AI продемонстрирована возможность обучения роботов выполнению задач, отсутствовавших в обучающем датасете.  Метод позволяет ускорить и упростить процесс обучения роботов. Роботы в реальном мире неизбежно столкнутся с новыми…

Модель обучили находить оптимальную схему лечения

4 февраля 2022

Модель обучили находить оптимальную схему лечения

Microsoft разработала алгоритм обучения с подкреплением, предлагающий для текущего состояния пациента наиболее эффективную тактику лечения. Модель нацелена на ускорение принятия решений в здравоохранении в условиях ограниченного количества медицинских данных. Модель…

В OpenAI обучили модель доказывать теоремы

4 февраля 2022

В OpenAI обучили модель доказывать теоремы

OpenAI представила нейросеть, доказывающую теоремы. Модель достигла точности 41% на miniF2F — датасете школьных олимпиадных задач. Для поиска доказательств используется языковая модель, обученная по принципу обучения школьников: каждый раз, когда…

AlphaCode: модель генерации кода по описанию DeepMind

3 февраля 2022

AlphaCode: модель генерации кода по описанию DeepMind

DeepMind представила систему генерации кода AlphaCode с 41 миллиардом параметров. AlphaCode превосходит OpenAI Codex и генерирует код на 12 языках. Согласно исследованию Кембриджского университета, более половины рабочего времени разработчиков тратится…

Нейросеть обучили высокоточно отделять объект от фона

25 января 2022

Нейросеть обучили высокоточно отделять объект от фона

В Google разработали нейросеть, с высокой точностью отделяющую объект от фона на изображении. Модель используется в портретном режиме съемки на Pixel 6. При классической сегментации изображения каждый пиксель относится либо…

HyperStyle: фотореалистичное редактирование изображений

24 января 2022

HyperStyle: фотореалистичное редактирование изображений

HyperStyle — нейросеть, модифицирующая отдельные параметры объектов на фотографиях. C помощью HyperStyle можно изменить прическу человека или цвет машины. Нейросеть, обученная на изображениях объектов одного типа, позволяет практически в реальном времени…

Разработан робот, управляемый мозгом пациента

7 января 2022

Разработан робот, управляемый мозгом пациента

Исследователи из Федеральной политехнической школы Лозанны разработали робота, управляемого на основе электрических сигналов, поступающих от мозга. Таким роботом смогут пользоваться люди с параличом. Разработка робота была нацелена на помощь людям…