Qwen2: открытая языковая модель, превосходящая LLAMA 3 на большинстве бенчмарков

Переход от Qwen1.5 к Qwen2 наконец состоялся, что стало прорывом в области языковых моделей. Новый state-of-the-art среди открытых моделей, Qwen 2, превосходит Llama 3 на большинстве бенчмарков.

Зоопарк моделей Qwen2

Qwen2 представляет разнообразие предварительно обученных и настроенных моделей, доступных в пяти различных размерах: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B и Qwen2-72B. Такой набор моделей позволяет подобрать оптимальную модель исходя из вычислительных потребностей и случаев использования. Гибкость и масштабируемость обеспечена.

27 языков

Расширяя лингвистическое мастерство своего предшественника, Qwen2 устанавливает новый стандарт, интегрируя данные обучения из обширного репертуара языков. Помимо английского и китайского, эти модели были отточены на наборах данных, охватывающих 27 дополнительных языков, укрепляя их адаптивность и глобальную значимость.

Написание кода и математика

Qwen2 превзошла современный открытые модели на бенчмарках по написанию кода и решении математических задач. И на каверзных задачах по программированию, и на сложных задачах по математике, эти модели показывают недостижимую точность.

Понимание контекста

Qwen2-7B-Instruct и Qwen2-72B-Instruct поддерживают расширенную длину контекста до 128K токенов. Обрабатывая огромные объемы информации, эти модели позволят пользователям решать сложные задачи с недостижимой для Qwen 1.5 и других открытых моделей глубиной и точностью.