NVIDIA Eureka: агент для автономного обучения роботов

22 октября 2023

NVIDIA Eureka: агент для автономного обучения роботов

NVIDIA представила Eureka – агента на базе GPT-4 c открытым исходным кодом, обучающего роботов сложным навыкам, таким как выполнение трюков и работу с ножницами. Большие языковые модели ранее уже показали…

OpenAI открыла возможность дообучать модель GPT-3.5 Turbo для конкретных задач

22 августа 2023
GPT 3.5 turbo finetuning

OpenAI открыла возможность дообучать модель GPT-3.5 Turbo для конкретных задач

GPT-3.5 Turbo от OpenAI получил обновление, позволяющее разработчикам дообучать модель для использования в своих приложениях, что позволит разработчикам возможность максимально раскрыть потенциал GPT-3.5. Теперь разработчики могут делать тонкую настройку (finetuning)…

Stability AI опубликовала датасет и функцию оценки Pickscore для обучения генеративных моделей

6 июня 2023
pickscore оценка изображений

Stability AI опубликовала датасет и функцию оценки Pickscore для обучения генеративных моделей

Pick-a-Pic — это датасет для обучения моделей генерации изображения из текста, содержащий более 500 000 изображений и оценки пользователей для каждого примера. Исследователи StabilityAI и Тель-Авивского университета опубликовали датасет Pick-a-Pic…

OpenAI открыла API обновленной модели Davinci на базе GPT-3

30 ноября 2022
openai davinci text-davinci-003,

OpenAI открыла API обновленной модели Davinci на базе GPT-3

Новая версия Davinci — text-davinci-003 — получила высокие оценки пользователей в решении логических задач, прописывании мотивации персонажей, стилизации текста для конкретной аудитории и создании креативного контента. По словам разработчиков OpenAI,…

Машинное обучение применили для помощи анастезиологам

18 февраля 2022

Машинное обучение применили для помощи анастезиологам

Ученые MIT продемонстрировали алгоритм машинного обучения для непрерывной автоматизации дозирования анестезирующего препарата пропофола. Алгоритм может улучшить процесс отслеживания состояния пациентов во время операции. Используя обучение с подкреплением, в котором нейронные сети…

Обучение с подкреплением для контроля термоядерных реакций

17 февраля 2022

Обучение с подкреплением для контроля термоядерных реакций

DeepMind объявила о применении обучения с подкреплением для управления состоянием плазмы в ходе термоядерной реакции. Алгоритм DeepMind позволил повысить стабильность процесса управляемого термоядерного синтеза на токамаке. Ядерный синтез — многообещающий…

Модель обучили находить оптимальную схему лечения

4 февраля 2022

Модель обучили находить оптимальную схему лечения

Microsoft разработала алгоритм обучения с подкреплением, предлагающий для текущего состояния пациента наиболее эффективную тактику лечения. Модель нацелена на ускорение принятия решений в здравоохранении в условиях ограниченного количества медицинских данных. Модель…

Модель OpenAI генерирует краткие пересказы книг

28 сентября 2021

Модель OpenAI генерирует краткие пересказы книг

В OpenAI обучили нейросеть пересказывать содержание текста и целых книг. Модель основана на GPT-3 и использует метод рекурсивного разложения, то есть сначала создает пересказы небольших частей книги и затем объединяет…

7 сайтов датасетами в открытом доступе

2 сентября 2021
Public datasets open-access

7 сайтов датасетами в открытом доступе

В статье приводится обзор сайтов, содержащих десятки тысяч датасетов в открытом доступе. Датасеты, представленные на данных ресурсах, покрывают такие области, как здравоохранение, география, социология, безопасность, транспорт и многие другие. Google…

Samsung использует искусственный интеллект для разработки чипов

19 августа 2021

Samsung использует искусственный интеллект для разработки чипов

Samsung использует систему искусственного интеллекта DSO.ai компании Synopsys для разработки нового поколения ARM-микропроцессоров Exynos, используемых в смартфонах компании. В Synopsys заявляют, что метод обучения с подкреплением позволяет более чем в…

Робота обучили передвигаться, как четвероногое животное

7 апреля 2020

Робота обучили передвигаться, как четвероногое животное

Исследователи из UC Berkley обучили робота имитировать поведение собаки с помощью обучения с подкреплением. Предложенный фреймворк масштабируется на другие виды животных. Модель получает на вход видеоролик с записью движения животного.…

RL-агент от DeepMind обошел человека во всех 57 играх Atari 2600

1 апреля 2020

RL-агент от DeepMind обошел человека во всех 57 играх Atari 2600

DeepMind разработали RL-агента Agent57, который обошел человека во всех 57 играх Atari 2600. Agent57 совмещает в себе алгоритм для эффективного исследования среды с мета-контроллером. Мета-контроллер отвечает за адаптацию исследования среды…

SMiRL: минимизация неожиданности для RL-агентов в динамических средах

17 декабря 2019

SMiRL: минимизация неожиданности для RL-агентов в динамических средах

Живые организмы стараются найти такое состояние, в котором поддерживается постоянство внутренней среды (гомеостаз). Исследователи из UC Berkley предположили, что такой поиск постоянства среди хаоса применим к искусственным агентам. SMiRL —…

Мультиагентная RL-система получила титул Грандмастера в StarCraft II

1 ноября 2019

Мультиагентная RL-система получила титул Грандмастера в StarCraft II

Модель AlphaStar от DeepMind обучилась играть в StarCraft II на уровне Грандмастера. В общем рейтинге модель обошла 99.8% активных игроков. Уровень Грандмастера был достигнут для всех трех типов игроков: Protoss,…

Spiral++: RL-агента обучили рисовать лица людей

9 октября 2019

Spiral++: RL-агента обучили рисовать лица людей

Spiral++ — это генеративный алгоритм, который моделирует процесс рисования объектов. RL-агенты в Spiral++ используются как генеративные модели изображений. Агент работает в среде, которая симулирует холст. Дискриминатор контролирует реалистичность сгенерированных изображений…

Исследователи из Гарварда обучили RL-алгоритм для управления нанодроном

30 сентября 2019

Исследователи из Гарварда обучили RL-алгоритм для управления нанодроном

В Гарварде обучили RL-алгоритм, который в реальном времени управляет нанодроном и ищет целевой объект. В данном случае целевым объектом был источник света. Модель была встроена в устройство. Вычисления производятся с…

Исследователи из OpenAI обучили нейросеть играть в прятки

18 сентября 2019

Исследователи из OpenAI обучили нейросеть играть в прятки

Исследователи из OpenAI обучили RL-агентов играть в прятки в командах. По окончании обучения модели агенты самостоятельно выучили такие стратегии, как искать спрятавшихся, строить укрытия и блокировать предметы, которые помогают ищущим…

PHYRE: как обучить RL-агента решать физические задачи

16 августа 2019

PHYRE: как обучить RL-агента решать физические задачи

PHYRE — это 2D-симулятор с 50 видами физических головоломок для обучения RL-агентов. Всего в симуляторе 5 тысяч головоломок. Задачи были разработаны исследователями из Facebook AI. Несмотря на то, что головоломки…

DeepMind опубликовали библиотеку для RL экспериментов

14 августа 2019
deepmind maths challenge

DeepMind опубликовали библиотеку для RL экспериментов

bsuite — это коллекция экспериментов для исследования поведения разных RL-агентов на общих задачах. Библиотека автоматизирует оценку и анализ поведения агентов на задачах. Она служит для упрощения создания повторяемых исследований. У…

Оптимальная аугментация данных для задачи распознавания объектов от Google Brain

29 июня 2019
аугментация данных

Оптимальная аугментация данных для задачи распознавания объектов от Google Brain

Исследователи из Google Brain разработали метод аугментации данных, который увеличивает точность модели на 2.3 пункта для COCO и на 2.7 для PASCAL-VOC. Аугментация данных — это увеличение выборки для обучения…

OFC: новый метод для поиска архитектуры модели от Google AI

26 июня 2019

OFC: новый метод для поиска архитектуры модели от Google AI

В Google AI разработали новый метод подбора модели обучения с подкреплением. Использование метода сокращает количество моделей для тестирования в реальных экспериментах.  Обучение с подкреплением — это такая группа алгоритмов, в…