Anthropic представила Claude 3.5 Sonnet, которая превосходит GPT-4o на ключевых бенчмарках

21 июня 2024
claude 3.5 sonnet by anthropic

Anthropic представила Claude 3.5 Sonnet, которая превосходит GPT-4o на ключевых бенчмарках

Anthropic представила новую большую языковую модель Claude 3.5 Sonnet. Она уже доступна в чат-боте ClaudeAI, Anthropic API, Amazon Bedrock, and Google Cloud’s Vertex AI. Claude 3.5 Sonnet превосходит GPT-4o на…

FractalGPT запустил агента вопросно-ответной системы для общения с загруженными документами

14 декабря 2023
fractalgpt

FractalGPT запустил агента вопросно-ответной системы для общения с загруженными документами

Разработчики FractalGPT запустили QA-агента FractalGPT для работы с документами, который позволяет использовать в диалогах загруженные пользователями PDF, TXT и DOCX файлы. Ключевые особенности FractalGPT QA: Обработка документов любой длины, без типичного…

«Компактный гигант» Mistral 7B превзошел результаты Llama2 13B и Llama 34B

1 октября 2023
Mistral 7B vs Llama 2

«Компактный гигант» Mistral 7B превзошел результаты Llama2 13B и Llama 34B

Команда Mistral AI представила Mistral 7B — открытую языковую модель из 7,3 миллиардов параметров, которая превосходит вдвое большую модель Llama 2 13B на всех бенчмарках. При этом Mistral 7B достигает…

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

29 сентября 2023
TinyML & Efficient DL Computing

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

В последние годы большие языковые и диффузные модели продемонстрировали впечатляющие результаты, но их требовательность к вычислительным ресурсам и потребление памяти ставит перед исследователями и разработчиками серьезные вызовы. Курс TinyML &…

Arthur Bench: фреймворк для оценки языковых моделей

20 августа 2023
arthur bench

Arthur Bench: фреймворк для оценки языковых моделей

Американский стартап Arthur опубликовал в открытом доступе фреймворк Bench для оценки и сравнения производительности больших языковых моделей. Инструмент позволит пользователям выбрать языковую модель, наиболее подходящую для решения конкретной задачи, укажет…

ReLoRA: метод увеличения производительности обучения больших языковых моделей

16 августа 2023
relora method

ReLoRA: метод увеличения производительности обучения больших языковых моделей

ReLoRA — метод обучения больших языковых моделей-трансформеров с использованием матриц низкого ранга, который увеличивает производительность обучения. Эффективность метода возрастает с увеличением масштабов моделей. На модели с 1,3 миллиардами параметров использование…

AudioPaLM: мультимодальная модель от Google для голосового перевода

29 июня 2023
audiopalm google

AudioPaLM: мультимодальная модель от Google для голосового перевода

Google представила AudioPaLM — большую языковую модель для обработки и генерации речи, объединяющую две языковые модели от Google — PaLM-2 и AudioLM — в мультимодальную архитектуру. Модель умеет распознавать речь,…

Российский стартап представил чатбота-психолога Sabina AI

7 ноября 2022
chatbot-sabina-ai

Российский стартап представил чатбота-психолога Sabina AI

Российский стартап Аватар Машина выпустил генеративного чатбота-психолога с искусственным интеллектом Sabina AI. Бот мгновенно генерирует полные и развернутые ответы на заданную психологическую проблему или ситуацию, описанную пользователем. Sabina уже доступна…

Первый в мире NLP ассистент на базе GPT-3 доступен в Appstore

26 августа 2022

Первый в мире NLP ассистент на базе GPT-3 доступен в Appstore

ParagraphAI готов изменить наше представление о писательстве: приложение мгновенно генерирует оригинальные и точные абзацы текста на заданную тему с правильной грамматикой и возможностью коррекции тона. ParagraphAI уже месяц доступен для…

META опубликовала модель для перевода текста на 200 языков

10 июля 2022
META AI Model translate 200 languages

META опубликовала модель для перевода текста на 200 языков

Meta выложила в открытый доступ модель NLLB-200 для перевода текста на 200 языков. Проект «No Language Left Behind» является частью планов Meta по поддержке редко используемых языков и разработке универсального…

Нейросеть генерирует упражнения для изучения языков по фотографиям

11 сентября 2021
picklang

Нейросеть генерирует упражнения для изучения языков по фотографиям

PickLang — это приложение, которое дает возможность изучать языки самым естественным для человека способом — исследуя окружающий мир. Приложение генерирует упражнения по пользовательским фотографиям в режиме реального времени. В основе…

IBM на 57% увеличила качество распознавания речи в сервисе Watson Speech to Text

29 апреля 2021

IBM на 57% увеличила качество распознавания речи в сервисе Watson Speech to Text

Улучшенная стратегия обучения нейронных сетей позволила IBM значительно увеличить эффективность средства преобразования речи в текст. Сервис работает на восьми языках и предоставляет рекордно высокую скорость обработки телефонных разговоров. Модель состоит…

TextFlint: библиотека для анализа устойчивости NLP-моделей

8 апреля 2021

TextFlint: библиотека для анализа устойчивости NLP-моделей

TextFlint – мультиязычная, многозадачная платформа для анализа устойчивости NLP-моделей. В открытом доступе для английского и китайского языков, другие языки разрабатываются. Включает инструменты обработки текста:  общие и специфические преобразования текста; выделение…

CSTR: нейросеть распознает текст на изображениях сцены

1 марта 2021

CSTR: нейросеть распознает текст на изображениях сцены

CSTR — это сверточная нейросеть, которая распознает текст на изображениях сцены. Превалирующая часть предыдущих работ рассматривает задачу распознавания текста на изображении сцены как задачу сегментации и seq2seq. Предложенная модель решает…

TransGAN: две Transformer модели как одна GAN

26 февраля 2021

TransGAN: две Transformer модели как одна GAN

TransGAN — GAN-модель, в которой генератор и дискриминатор состоят из двух Transformer-архитектур. Традиционно в GAN архитектуре используются свертки. В TransGAN свертки заменили на Transformer. Код проекта доступен в открытом репозитории…

Twitter открыли архив твитов для научных исследователей

20 февраля 2021

Twitter открыли архив твитов для научных исследователей

Twitter открыли архив твитов для научных исследователей. Так компания поддерживает исследования онлайн-дискурса и трендов на платформе. Подробнее данные и доступ к ним Twitter запустили новый тип подключения к их API,…

TAPAS: нейросеть ищет ответы на вопросы в табличных данных

30 января 2021

TAPAS: нейросеть ищет ответы на вопросы в табличных данных

TAPAS — это нейросетевая модель для поиска ответов на вопросы в табличных данных. Нейросеть является расширением двунаправленной Transformer-модели BERT со специальными эмбеддингами для поиска ответов. Модель разрабатывали в Google AI.…

BART: нейросеть для суммаризации текста

16 марта 2020
bart суммаризация текста

BART: нейросеть для суммаризации текста

BART — это state-of-the-art нейросеть для суммаризации текстов. Задача абстрактивной суммаризации текстов предполагает, что модель получает на вход текст, а на выходе модель генерирует текст с описанием общих идей из…