OpenAI открыла API обновленной модели Davinci на базе GPT-3

30 ноября 2022
openai davinci text-davinci-003,

OpenAI открыла API обновленной модели Davinci на базе GPT-3

Новая версия Davinci — text-davinci-003 — получила высокие оценки пользователей в решении логических задач, прописывании мотивации персонажей, стилизации текста для конкретной аудитории и создании креативного контента. По словам разработчиков OpenAI,…

Машинное обучение применили для помощи анастезиологам

18 февраля 2022

Машинное обучение применили для помощи анастезиологам

Ученые MIT продемонстрировали алгоритм машинного обучения для непрерывной автоматизации дозирования анестезирующего препарата пропофола. Алгоритм может улучшить процесс отслеживания состояния пациентов во время операции. Используя обучение с подкреплением, в котором нейронные сети…

Обучение с подкреплением для контроля термоядерных реакций

17 февраля 2022

Обучение с подкреплением для контроля термоядерных реакций

DeepMind объявила о применении обучения с подкреплением для управления состоянием плазмы в ходе термоядерной реакции. Алгоритм DeepMind позволил повысить стабильность процесса управляемого термоядерного синтеза на токамаке. Ядерный синтез — многообещающий…

Модель обучили находить оптимальную схему лечения

4 февраля 2022

Модель обучили находить оптимальную схему лечения

Microsoft разработала алгоритм обучения с подкреплением, предлагающий для текущего состояния пациента наиболее эффективную тактику лечения. Модель нацелена на ускорение принятия решений в здравоохранении в условиях ограниченного количества медицинских данных. Модель…

Модель OpenAI генерирует краткие пересказы книг

28 сентября 2021

Модель OpenAI генерирует краткие пересказы книг

В OpenAI обучили нейросеть пересказывать содержание книг. Модель основана на GPT-3 и использует метод рекурсивного разложения, то есть сначала создает пересказы небольших частей книги и затем объединяет их. По сравнению…

7 сайтов с общедоступными датасетами

2 сентября 2021

7 сайтов с общедоступными датасетами

В статье приводится обзор сайтов, содержащих десятки тысяч датасетов в открытом доступе. Датасеты, представленные на данных ресурсах, покрывают такие области, как здравоохранение, география, социология, безопасность, транспорт и многие другие. Google…

Samsung использует искусственный интеллект для разработки чипов

19 августа 2021

Samsung использует искусственный интеллект для разработки чипов

Samsung использует систему искусственного интеллекта DSO.ai компании Synopsys для разработки нового поколения ARM-микропроцессоров Exynos, используемых в смартфонах компании. В Synopsys заявляют, что метод обучения с подкреплением позволяет более чем в…

Робота обучили передвигаться, как четвероногое животное

7 апреля 2020

Робота обучили передвигаться, как четвероногое животное

Исследователи из UC Berkley обучили робота имитировать поведение собаки с помощью обучения с подкреплением. Предложенный фреймворк масштабируется на другие виды животных. Модель получает на вход видеоролик с записью движения животного.…

RL-агент от DeepMind обошел человека во всех 57 играх Atari 2600

1 апреля 2020

RL-агент от DeepMind обошел человека во всех 57 играх Atari 2600

DeepMind разработали RL-агента Agent57, который обошел человека во всех 57 играх Atari 2600. Agent57 совмещает в себе алгоритм для эффективного исследования среды с мета-контроллером. Мета-контроллер отвечает за адаптацию исследования среды…

SMiRL: минимизация неожиданности для RL-агентов в динамических средах

17 декабря 2019

SMiRL: минимизация неожиданности для RL-агентов в динамических средах

Живые организмы стараются найти такое состояние, в котором поддерживается постоянство внутренней среды (гомеостаз). Исследователи из UC Berkley предположили, что такой поиск постоянства среди хаоса применим к искусственным агентам. SMiRL —…

Мультиагентная RL-система получила титул Грандмастера в StarCraft II

1 ноября 2019

Мультиагентная RL-система получила титул Грандмастера в StarCraft II

Модель AlphaStar от DeepMind обучилась играть в StarCraft II на уровне Грандмастера. В общем рейтинге модель обошла 99.8% активных игроков. Уровень Грандмастера был достигнут для всех трех типов игроков: Protoss,…

Spiral++: RL-агента обучили рисовать лица людей

9 октября 2019

Spiral++: RL-агента обучили рисовать лица людей

Spiral++ — это генеративный алгоритм, который моделирует процесс рисования объектов. RL-агенты в Spiral++ используются как генеративные модели изображений. Агент работает в среде, которая симулирует холст. Дискриминатор контролирует реалистичность сгенерированных изображений…

Исследователи из Гарварда обучили RL-алгоритм для управления нанодроном

30 сентября 2019

Исследователи из Гарварда обучили RL-алгоритм для управления нанодроном

В Гарварде обучили RL-алгоритм, который в реальном времени управляет нанодроном и ищет целевой объект. В данном случае целевым объектом был источник света. Модель была встроена в устройство. Вычисления производятся с…

Исследователи из OpenAI обучили нейросеть играть в прятки

18 сентября 2019

Исследователи из OpenAI обучили нейросеть играть в прятки

Исследователи из OpenAI обучили RL-агентов играть в прятки в командах. По окончании обучения модели агенты самостоятельно выучили такие стратегии, как искать спрятавшихся, строить укрытия и блокировать предметы, которые помогают ищущим…

PHYRE: как обучить RL-агента решать физические задачи

16 августа 2019

PHYRE: как обучить RL-агента решать физические задачи

PHYRE — это 2D-симулятор с 50 видами физических головоломок для обучения RL-агентов. Всего в симуляторе 5 тысяч головоломок. Задачи были разработаны исследователями из Facebook AI. Несмотря на то, что головоломки…

DeepMind опубликовали библиотеку для RL экспериментов

14 августа 2019
deepmind maths challenge

DeepMind опубликовали библиотеку для RL экспериментов

bsuite — это коллекция экспериментов для исследования поведения разных RL-агентов на общих задачах. Библиотека автоматизирует оценку и анализ поведения агентов на задачах. Она служит для упрощения создания повторяемых исследований. У…

Как делать аугментацию данных для задачи распознавания объектов

29 июня 2019

Как делать аугментацию данных для задачи распознавания объектов

Исследователи из Google Brain разработали метод поиска оптимальной обработки изображений перед обучением модели. Расширение данных с помощью методов аугментации увеличивает точность модели — на 2.3 пункта для COCO и на…

OFC: новый метод для поиска архитектуры модели от Google AI

26 июня 2019

OFC: новый метод для поиска архитектуры модели от Google AI

В Google AI разработали новый метод подбора модели обучения с подкреплением. Использование метода сокращает количество моделей для тестирования в реальных экспериментах.  Обучение с подкреплением — это такая группа алгоритмов, в…

Google Research Football: новая среда для обучения RL-агентов

10 июня 2019

Google Research Football: новая среда для обучения RL-агентов

Google AI опубликовали новую задачу для тренировки алгоритмов обучения с подкреплением (RL). Агенты будут учиться играть в футбол. Обучения с подкреплением фокусируется на задаче обучить агентов взаимодействовать со средой, в…

DeepMind обучили агентов играть в многопользовательскую игру на уровне человека

1 июня 2019

DeepMind обучили агентов играть в многопользовательскую игру на уровне человека

Исследователи из DeepMind обучили мультиагентную систему, которая играет в Quake III Arena: Capture The Flag так же хорошо, как человек. Методы обучения с подкреплением (RL) показывают хорошие результаты в случае…

MineRL: датасет с демонстрациями игры в Minecraft для решения RL задач

13 мая 2019

MineRL: датасет с демонстрациями игры в Minecraft для решения RL задач

Исследователи из Microsoft, CMU и других университетов опубликовали датасет с записями игр в Minecraft. Соревнование открывается 1-го июня и длится до 25-го октября. Участникам предлагается обучить модель, которая сумела бы…