Переход от Qwen1.5 к Qwen2 наконец состоялся, что стало прорывом в области языковых моделей. Новый state-of-the-art среди открытых моделей, Qwen 2, превосходит Llama 3 на большинстве бенчмарков.
Зоопарк моделей Qwen2
Qwen2 представляет разнообразие предварительно обученных и настроенных моделей, доступных в пяти различных размерах: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B и Qwen2-72B. Такой набор моделей позволяет подобрать оптимальную модель исходя из вычислительных потребностей и случаев использования. Гибкость и масштабируемость обеспечена.
27 языков
Расширяя лингвистическое мастерство своего предшественника, Qwen2 устанавливает новый стандарт, интегрируя данные обучения из обширного репертуара языков. Помимо английского и китайского, эти модели были отточены на наборах данных, охватывающих 27 дополнительных языков, укрепляя их адаптивность и глобальную значимость.
Написание кода и математика
Qwen2 превзошла современный открытые модели на бенчмарках по написанию кода и решении математических задач. И на каверзных задачах по программированию, и на сложных задачах по математике, эти модели показывают недостижимую точность.
Понимание контекста
Qwen2-7B-Instruct и Qwen2-72B-Instruct поддерживают расширенную длину контекста до 128K токенов. Обрабатывая огромные объемы информации, эти модели позволят пользователям решать сложные задачи с недостижимой для Qwen 1.5 и других открытых моделей глубиной и точностью.