GPT-4: OpenAI выпустила мультимодальную версию GPT

15 марта 2023

GPT-4: OpenAI выпустила мультимодальную версию GPT

OpenAI сообщила о создании GPT-4 – обновленной версии GPT-3.5, способной принимать на вход изображения и сдающей экзамены лучше 90% студентов. Модель уже доступна для использования подписчикам ChatGPT Plus и интегрирована…

Интерфейс мозг-компьютер для синтеза речи

9 марта 2023

Интерфейс мозг-компьютер для синтеза речи

Исследователи Стэнфордского университета разработали интерфейс мозг-компьютер для синтеза речи из сигналов, захваченных в мозге пациента и обработанных рекуррентной нейросетью. Прототип системы может декодировать речь со скоростью 62 слова в минуту,…

Lang: анализ диалогов клиентов со службой поддержки

28 мая 2022

Lang: анализ диалогов клиентов со службой поддержки

Стартап Lang разработал систему, которая интегрируется со службой поддержки и CRM для автоматического распознавания темы разговора и выявления трендов в причинах обращений клиентов. Инструмент использует неконтролируемую модель обучения для адаптации…

Flamingo: мультимодальная модель DeepMind

9 мая 2022

Flamingo: мультимодальная модель DeepMind

Flamingo – мультимодальная модель DeepMind, генерирующая текстовое описание фото, видео и звуков. Модель превосходит предыдущие state-of-the-art модели в 16 задачах, а ее особенностью является возможность обучаться на нескольких примерах. Обычно…

Израильский стартап упрощает найм сотрудников с использованием обработки естественного языка

9 мая 2022

Израильский стартап упрощает найм сотрудников с использованием обработки естественного языка

Myinterview – израильский стартап, разрабатывающий инструменты машинного обучения для ускорения и упрощения процессов найма для компаний. Платформа Myinterview расшифровывает видеоинтервью кандидатов, оценивает их навыки и выставляет оценку. Основатели утверждают, что…

Google Cloud Manufacturing: расширенная аналитика на производствах

9 мая 2022

Google Cloud Manufacturing: расширенная аналитика на производствах

Google и Ford разработали инструмент Google Cloud Manufacturing, нацеленный на объединение и унификацию разрозненных данных на производствах. Инструмент предоставляет возможность анализировать производственные процессы и обучать широкий класс моделей. Операции на…

MASSIVE: датасет Amazon для многоязычного обучения моделей

29 апреля 2022

MASSIVE: датасет Amazon для многоязычного обучения моделей

Amazon представил open-source датасет MASSIVE с переводами текстов на 51 язык. Датасет нацелен на создание моделей обработки естественного языка, которые могут быть легко обобщены на новые языки. В основе MASSIVE…

PaLM: языковая модель Google с 540 миллиардами параметров

8 апреля 2022

PaLM: языковая модель Google с 540 миллиардами параметров

Google представила PaLM – языковую модель с 540 миллиардами параметров. PaLM превзошла существующие языковые модели в большинстве бенчмарков. Модель обучена с использованием 6144 тензорных процессоров Google TPU на платформе параллельных…

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

1 апреля 2022

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

Microsoft представила Jigsaw – инструмент откладки выдачи text-to-code моделей путем предоставления примеров выходных данных. При работе с Python Pandas инструмент позволил повысить точность Codex более чем в два раза. C…

Deepdub: синтетический дубляж фильмов

16 февраля 2022

Deepdub: синтетический дубляж фильмов

Израильский стартап Deepdub разработал алгоритм дубляжа фильмов с использованием синтетических голосов. Инструменты компании позволяют скопировать оригинальный голос актера и сократить расходы на озвучивание. В среднем на пять минут фильма в…

В OpenAI обучили модель доказывать теоремы

4 февраля 2022

В OpenAI обучили модель доказывать теоремы

OpenAI представила нейросеть, доказывающую теоремы. Модель достигла точности 41% на miniF2F — датасете школьных олимпиадных задач. Для поиска доказательств используется языковая модель, обученная по принципу обучения школьников: каждый раз, когда…

AlphaCode: модель генерации кода по описанию DeepMind

3 февраля 2022

AlphaCode: модель генерации кода по описанию DeepMind

DeepMind представила систему генерации кода AlphaCode с 41 миллиардом параметров. AlphaCode превосходит OpenAI Codex и генерирует код на 12 языках. Согласно исследованию Кембриджского университета, более половины рабочего времени разработчиков тратится…

Модель обучили предсказывать потенциально опасные штаммы коронавируса

24 января 2022

Модель обучили предсказывать потенциально опасные штаммы коронавируса

Компании BioNTech и InstaDeep разработали «систему раннего предупреждения» для выявления новых опасных вариантов коронавируса. Система выявила 12 из 13 вариантов коронавируса, которые Всемирная организация здравоохранения выделила как потенциально опасные. Система нацелена…

Vistry: оптимизация работы точек общественного питания

23 января 2022

Vistry: оптимизация работы точек общественного питания

Cтартап Vistry разработал комплексную систему на основе глубокого обучения, оптимизирующую работу заведений общественного питания. Vistry принимает заказы с помощью распознавания голоса, отслеживает свежесть продуктов и перераспределяет нагрузку в цехах в…

GLIDE: модель OpenAI генерации изображений по тексту

27 декабря 2021

GLIDE: модель OpenAI генерации изображений по тексту

GLIDE — модель OpenAI генерации изображения по его описанию. GLIDE превосходит DALL-E и при этом имеет в 3 раза меньше параметров. В январе 2021-го года OpenAI представила DALL-E, версию с…

В OpenAI обучили модель искать ответы на вопросы в Интернете

19 декабря 2021

В OpenAI обучили модель искать ответы на вопросы в Интернете

OpenAI представила WebGPT — модель, выполняющую поиск ответа на вопрос в Интернете. WebGPT комбинирует информацию из нескольких источников и генерирует текст ответа. Языковые модели, такие как GPT-3, полезны для многих…

RETRO: языковая модель DeepMind

10 декабря 2021

RETRO: языковая модель DeepMind

DeepMind представила языковую модель RETRO, в которой реализована схема обучения, основанная на использовании внешней памяти. RETRO демонстрирует сравнимые с GPT-3 результаты несмотря на то, что она имеет в 25 раз…

Intel анонсировала крупнейшие датасеты для распознавания речи

9 декабря 2021

Intel анонсировала крупнейшие датасеты для распознавания речи

Intel представила датасеты People’s Speech и MSWC, нацеленные на распознавание и транскрибирование разговорной речи. Оба датасета являются одними из крупнейших в своем классе и включают аудиозаписи на 59 языках. Датасет People’s Speech…

Расширенные возможности обработки естественного языка в Watson Discovery

28 ноября 2021

Расширенные возможности обработки естественного языка в Watson Discovery

IBM объявила о добавлении новых функций обработки естественного языка в Watson Discovery — платформе для поиска и анализа текста, которая может извлекать важную информацию, скрытую в корпоративных данных. Добавленный функционал включает…

Google тестирует приложение для людей с нарушениями речи

20 ноября 2021

Google тестирует приложение для людей с нарушениями речи

Google приглашает людей с нарушениями речи присоединиться к тестированию Android-приложения Project Relate. Приложение нацелено на упрощение общения людей с инсультом, БАС, болезнью Паркинсона и другими заболеваниями. Проект Relate стал возможным благодаря…

Commonsense-Dialogues: датасет Amazon повседневных диалогов

12 ноября 2021

Commonsense-Dialogues: датасет Amazon повседневных диалогов

Commonsense-Dialogues — датасет Amazon, содержащий 11 000 диалогов из повседневной жизни. Датасет нацелен на обучение моделей понимать скрытые смыслы реплик. На сегодняшний день ИИ-ассистенты плохо справляются с распознаванием эмоций и…