NLP / Нейросети и глубокое обучение

Anthropic представила Claude 3.5 Sonnet, которая превосходит GPT-4o на ключевых бенчмарках

21 июня 2024

Anthropic представила Claude 3.5 Sonnet, которая превосходит GPT-4o на ключевых бенчмарках

Anthropic представила новую большую языковую модель Claude 3.5 Sonnet. Она уже доступна в чат-боте ClaudeAI, Anthropic API, Amazon Bedrock, and Google Cloud’s Vertex AI. Claude 3.5 Sonnet превосходит GPT-4o на…

FractalGPT запустил агента вопросно-ответной системы для общения с загруженными документами

14 декабря 2023

$fractalgpt$

FractalGPT запустил агента вопросно-ответной системы для общения с загруженными документами

Разработчики FractalGPT запустили QA-агента FractalGPT для работы с документами, который позволяет использовать в диалогах загруженные пользователями PDF, TXT и DOCX файлы. Ключевые особенности FractalGPT QA: Обработка документов любой длины, без типичного…

«Компактный гигант» Mistral 7B превзошел результаты Llama2 13B и Llama 34B

1 октября 2023

«Компактный гигант» Mistral 7B превзошел результаты Llama2 13B и Llama 34B

Команда Mistral AI представила Mistral 7B — открытую языковую модель из 7,3 миллиардов параметров, которая превосходит вдвое большую модель Llama 2 13B на всех бенчмарках. При этом Mistral 7B достигает…

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

29 сентября 2023

29 сентября 2023

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

29 сентября 2023

В последние годы большие языковые и диффузные модели продемонстрировали впечатляющие результаты, но их требовательность к вычислительным ресурсам и потребление памяти ставит перед исследователями и разработчиками серьезные вызовы. Курс TinyML &…

Arthur Bench: фреймворк для оценки языковых моделей

20 августа 2023

Arthur Bench: фреймворк для оценки языковых моделей

Американский стартап Arthur опубликовал в открытом доступе фреймворк Bench для оценки и сравнения производительности больших языковых моделей. Инструмент позволит пользователям выбрать языковую модель, наиболее подходящую для решения конкретной задачи, укажет…

ReLoRA: метод увеличения производительности обучения больших языковых моделей

16 августа 2023

ReLoRA: метод увеличения производительности обучения больших языковых моделей

ReLoRA — метод обучения больших языковых моделей-трансформеров с использованием матриц низкого ранга, который увеличивает производительность обучения. Эффективность метода возрастает с увеличением масштабов моделей. На модели с 1,3 миллиардами параметров использование…

AudioPaLM: мультимодальная модель от Google для голосового перевода

29 июня 2023

AudioPaLM: мультимодальная модель от Google для голосового перевода

Google представила AudioPaLM — большую языковую модель для обработки и генерации речи, объединяющую две языковые модели от Google — PaLM-2 и AudioLM — в мультимодальную архитектуру. Модель умеет распознавать речь,…

Российский стартап представил чатбота-психолога Sabina AI

7 ноября 2022

Российский стартап представил чатбота-психолога Sabina AI

Российский стартап Аватар Машина выпустил генеративного чатбота-психолога с искусственным интеллектом Sabina AI. Бот мгновенно генерирует полные и развернутые ответы на заданную психологическую проблему или ситуацию, описанную пользователем. Sabina уже доступна…

Первый в мире NLP ассистент на базе GPT-3 доступен в Appstore

26 августа 2022

Первый в мире NLP ассистент на базе GPT-3 доступен в Appstore

ParagraphAI готов изменить наше представление о писательстве: приложение мгновенно генерирует оригинальные и точные абзацы текста на заданную тему с правильной грамматикой и возможностью коррекции тона. ParagraphAI уже месяц доступен для…

Нейросеть генерирует упражнения для изучения языков по фотографиям

11 сентября 2021

Нейросеть генерирует упражнения для изучения языков по фотографиям

PickLang — это приложение, которое дает возможность изучать языки самым естественным для человека способом — исследуя окружающий мир. Приложение генерирует упражнения по пользовательским фотографиям в режиме реального времени. В основе…

IBM на 57% увеличила качество распознавания речи в сервисе Watson Speech to Text

29 апреля 2021

IBM на 57% увеличила качество распознавания речи в сервисе Watson Speech to Text

Улучшенная стратегия обучения нейронных сетей позволила IBM значительно увеличить эффективность средства преобразования речи в текст. Сервис работает на восьми языках и предоставляет рекордно высокую скорость обработки телефонных разговоров. Модель состоит…

TextFlint: библиотека для анализа устойчивости NLP-моделей

8 апреля 2021

TextFlint: библиотека для анализа устойчивости NLP-моделей

TextFlint – мультиязычная, многозадачная платформа для анализа устойчивости NLP-моделей. В открытом доступе для английского и китайского языков, другие языки разрабатываются. Включает инструменты обработки текста: общие и специфические преобразования текста; выделение…

NLP

Anthropic представила Claude 3.5 Sonnet, которая превосходит GPT-4o на ключевых бенчмарках

Anthropic представила Claude 3.5 Sonnet, которая превосходит GPT-4o на ключевых бенчмарках

FractalGPT запустил агента вопросно-ответной системы для общения с загруженными документами

FractalGPT запустил агента вопросно-ответной системы для общения с загруженными документами

«Компактный гигант» Mistral 7B превзошел результаты Llama2 13B и Llama 34B

«Компактный гигант» Mistral 7B превзошел результаты Llama2 13B и Llama 34B

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

MIT публикует бесплатный курс лекций TinyML & Efficient DL Computing на Youtube

Arthur Bench: фреймворк для оценки языковых моделей

Arthur Bench: фреймворк для оценки языковых моделей

ReLoRA: метод увеличения производительности обучения больших языковых моделей

ReLoRA: метод увеличения производительности обучения больших языковых моделей

AudioPaLM: мультимодальная модель от Google для голосового перевода

AudioPaLM: мультимодальная модель от Google для голосового перевода

Российский стартап представил чатбота-психолога Sabina AI

Российский стартап представил чатбота-психолога Sabina AI

Первый в мире NLP ассистент на базе GPT-3 доступен в Appstore

Первый в мире NLP ассистент на базе GPT-3 доступен в Appstore

Нейросеть генерирует упражнения для изучения языков по фотографиям

Нейросеть генерирует упражнения для изучения языков по фотографиям

IBM на 57% увеличила качество распознавания речи в сервисе Watson Speech to Text

IBM на 57% увеличила качество распознавания речи в сервисе Watson Speech to Text

TextFlint: библиотека для анализа устойчивости NLP-моделей

TextFlint: библиотека для анализа устойчивости NLP-моделей

CSTR: нейросеть распознает текст на изображениях сцены

CSTR: нейросеть распознает текст на изображениях сцены

TransGAN: две Transformer модели как одна GAN

TransGAN: две Transformer модели как одна GAN

Twitter открыли архив твитов для научных исследователей

Twitter открыли архив твитов для научных исследователей

TAPAS: нейросеть ищет ответы на вопросы в табличных данных

TAPAS: нейросеть ищет ответы на вопросы в табличных данных

BART: нейросеть для суммаризации текста

BART: нейросеть для суммаризации текста