data2vec: система мультимодального самообучения Meta AI

21 января 2022

data2vec: система мультимодального самообучения Meta AI

Meta AI разработала data2vec — первый высокопроизводительный алгоритм самообучения, который работает сразу с несколькими модальностями. data2vec, примененный отдельно к речи, изображениям и тексту, превзошел предыдущие лучшие алгоритмы компьютерного зрения и…

Разработан робот, управляемый мозгом пациента

7 января 2022

Разработан робот, управляемый мозгом пациента

Исследователи из Федеральной политехнической школы Лозанны разработали робота, управляемого на основе электрических сигналов, поступающих от мозга. Таким роботом смогут пользоваться люди с параличом. Разработка робота была нацелена на помощь людям…

GLIDE: модель OpenAI генерации изображений по тексту

27 декабря 2021

GLIDE: модель OpenAI генерации изображений по тексту

GLIDE — модель OpenAI генерации изображения по его описанию. GLIDE превосходит DALL-E и при этом имеет в 3 раза меньше параметров. В январе 2021-го года OpenAI представила DALL-E, версию с…

В OpenAI обучили модель искать ответы на вопросы в Интернете

19 декабря 2021

В OpenAI обучили модель искать ответы на вопросы в Интернете

OpenAI представила WebGPT — модель, выполняющую поиск ответа на вопрос в Интернете. WebGPT комбинирует информацию из нескольких источников и генерирует текст ответа. Языковые модели, такие как GPT-3, полезны для многих…

Uni-TTSv4: модель Microsoft, преобразовывающая текст в речь

19 декабря 2021

Uni-TTSv4: модель Microsoft, преобразовывающая текст в речь

Microsoft представила обновление Uni-TTS — модели, преобразовывающую текст в речь. Uni-TTSv4 обеспечивает наилучшее качество речи среди аналогичных state-of-the-art моделей и в ближайшее время будет доступна в Azure более чем на…

RETRO: языковая модель DeepMind

10 декабря 2021

RETRO: языковая модель DeepMind

DeepMind представила языковую модель RETRO, в которой реализована схема обучения, основанная на использовании внешней памяти. RETRO демонстрирует сравнимые с GPT-3 результаты несмотря на то, что она имеет в 25 раз…

GeoMol: предсказание структуры молекулы по ее графу

6 декабря 2021

GeoMol: предсказание структуры молекулы по ее графу

Исследователи MIT разработали нейросеть GeoMol, предсказывающую трехмерную структуру молекулы по ее двумерному графу. Этот метод может ускорить разработку новых лекарств. При разработке новых лекарств ученые ищут молекулы, которые могут присоединяться…

Нейросеть NASA обнаружила 301 экзопланету

29 ноября 2021

Нейросеть NASA обнаружила 301 экзопланету

NASA разработала нейронную сеть Exominer, идентифицирующую космические объекты по затуханию излучения от звезд. На основе данных миссии Kepler нейросеть обнаружила более 300 ранее неизвестных экзопланет. Когда планета проходит между Землей…

XLS-R: модель FAIR распознавания речи на 128 языках

21 ноября 2021

XLS-R: модель FAIR распознавания речи на 128 языках

FAIR выложила в открытый доступ код XLS-R — самообучающейся модели, выполняющей распознавание речи. XLS-R поддерживает 128 языков и превосходит в бенчмарках все предыдущие мультиязыковые модели. Цель, которую преследовали  разработчики XLS-R…

MetNet-2: модель Google предсказания погоды на 12 часов

16 ноября 2021

MetNet-2: модель Google предсказания погоды на 12 часов

Google AI представила MetNet-2 — улучшенную версию модели для предсказания погоды MetNet. MetNet-2 позволяет прогнозировать погоду на 12 часов вперед с пространственным разрешением 1 км и временным разрешением 2 минуты.…

PARP: алгоритм прунинга моделей распознавания речи

6 ноября 2021

PARP: алгоритм прунинга моделей распознавания речи

PARP — наиболее эффективный среди аналогов метод обрезки больших моделей распознавания речи. PARP может применяться для автоматического распознавания речи на редких языках. Технология распознавания речи стала более распространенной с ростом…

FAIR ReSkin: искусственная кожа для роботов

3 ноября 2021

FAIR ReSkin: искусственная кожа для роботов

FAIR представила ReSkin — материал с сенсорами, измеряющими местоположение контакта с предметом и величину приложенной силы. ReSkin планируется использовать для выполнения роботами действий, требующих высокой точности. На сегодняшний день роботы…

Языковые модели имитируют работу мозга

29 октября 2021

Языковые модели имитируют работу мозга

Ученые выявили схожесть работы моделей обработки естественного языка с деятельностью мозга во время восприятия языковой информации. В частности, предсказание следующего слова на основе уже введенных слов, широкое используемое в поисковых…

Модель Google SimVLM генерирует подписи к изображениям

25 октября 2021

Модель Google SimVLM генерирует подписи к изображениям

Google представила модель SimVLM, генерирующую текст по одному изображению. Возможности SimVLM включают формирование простого описания предложения, завершение предложения по нескольким первым словам и ответы на вопросы об объектах на изображении.…

Нейросеть обучили имитировать обонятельную систему плодовой мушки

20 октября 2021

Нейросеть обучили имитировать обонятельную систему плодовой мушки

Ученые создали трехслойную нейросеть, классифицирующую запахи. После обучения модели связи между нейронами в точности воспроизвели структуру обонятельной системы плодовой мушки. У плодовых мушек — организма, в котором обонятельная схема мозга…

Нейросеть обучили генерировать макияж для обхода систем распознавания лиц

4 октября 2021

Нейросеть обучили генерировать макияж для обхода систем распознавания лиц

Израильские исследователи представили модель, генерирующую макияж для обхода систем распознавания лиц. После нанесения косметики в соответствии с представленными нейросетью шаблонами лица участников эксперимента были распознаны лишь в 1,22% случаев. Генеративно-состязательная нейросеть…

Модель OpenAI генерирует краткие пересказы книг

28 сентября 2021

Модель OpenAI генерирует краткие пересказы книг

В OpenAI обучили нейросеть пересказывать содержание книг. Модель основана на GPT-3 и использует метод рекурсивного разложения, то есть сначала создает пересказы небольших частей книги и затем объединяет их. По сравнению…

IC-GAN: генерация синтетических изображений без обучения отдельным объектам

21 сентября 2021

IC-GAN: генерация синтетических изображений без обучения отдельным объектам

IC-GAN — набор моделей FAIR для генерации изображений, объекты и сцены на которых отсутствовали в обучающем датасете. IC-GAN можно использовать для аугментации данных. Генеративно-состязательные сети (GAN) — хорошо зарекомендовавший себя…

Невидимая клавиатура для смартфонов на основе декодеров

18 сентября 2021

Невидимая клавиатура для смартфонов на основе декодеров

Ученые разработали модель, позволяющую вводить текст на смартфонах на основе памяти пользователя о расположении букв в раскладке клавиатуры. Такая клавиатура позволяет набирать текст на 160% быстрее, чем при использовании экранной…

Нейросеть обучили имитировать биологический нейрон

12 сентября 2021

Нейросеть обучили имитировать биологический нейрон

Ученые подобрали архитектуру нейросети, воспроизводящей сложность биологического нейрона с точностью 99%. Исследование позволило впервые провести сопоставление биологических и искусственных нейронов. Ключевое сходство между искусственными и биологическими нейронами состоит в том,…

Модель Google AI распознает заболевания органов грудной клетки

5 сентября 2021

Модель Google AI распознает заболевания органов грудной клетки

Алгоритм глубокого обучения, разработанный в Google AI, распознает широкий класс заболеваний по рентгеновским снимкам грудной клетки. Модель оказалась способной признавать аномальными снимки пациентов с заболеваниями, не представленными в обучающем датасете.…