FLM-101B: языковую модель со 101 миллиардом параметров обучили с нуля «всего» за $100 000

24 сентября 2023
FLM 101B evaluating growth strategy

FLM-101B: языковую модель со 101 миллиардом параметров обучили с нуля «всего» за $100 000

Исследователи из Пекинского университета представили FLM-101B — открытую большую языковую модель с 101 миллиардом параметров, обученную с нуля на 300 миллиардах токенов при затратах «всего лишь» $100 000. Обучение таких…

LIMA: метод предобучения на 1000 примерах позволил достичь точности GPT-4

31 мая 2023
LIMA LLAMA

LIMA: метод предобучения на 1000 примерах позволил достичь точности GPT-4

Языковые модели обычно обучаются в два этапах: предварительное обучение без учителя и настройка под конкретные задачи и предпочтения пользователей. Новый метод LIMA (Less Is More for Alignment) основан на гипотезе,…

Как обучить нейросеть на шумных данных для задачи классификации

28 августа 2019

Как обучить нейросеть на шумных данных для задачи классификации

В Google предложили модифицированную логистическую функцию ошибки (Bi-Tempered Logistic Loss), которая устойчива к шумным данным. Качество ML-моделей напрямую зависит от качества данных, на которых они обучались. Данные из реального мира…

Нейросеть V2CNet обучает роботов повторять действия за человеком

1 апреля 2019
robot learning

Нейросеть V2CNet обучает роботов повторять действия за человеком

Ученые Итальянского университета совместно с исследователями из Australian Centre for Robotic Vision опубликовали алгоритм, который конвертирует демонстрационные видео в команды для роботов. Архитектура V2CNet Сеть V2CNet еть состоит из двух…

МРТ, чип в мозге и нейросети вернули подвижность парализованному человеку

3 октября 2018

МРТ, чип в мозге и нейросети вернули подвижность парализованному человеку

Исследователи много лет работают над методами на основе электрических импульсов, чтобы вернуть возможность двигаться людям с травмами спинного мозга и парализованными конечностями. Учёные из Университета Огайо и компании Batelle объявили, что…