fbpx
  • Архитектура Turing от Nvidia: что она дает и как получить максимум производительности

    Turing SDK

    Архитектура Turing – одно из главных достижений в компьютерной графике за 20 лет, по заявлению самой Nvidia. Turing SDK теперь доступен для разработчиков. Дизайнеры и художники могут создавать контент с улучшенной графикой, фотореалистичным рендерингом, использовать AI для обработки изображений и видео в режиме реального времени с помощью NVIDIA RTX. Рассказываем о разработках Nvidia, которые помогут исследователям раскрыть все возможности новой архитектуры.

    CUDA 10

    CUDA 10 включает поддержку Turing GPUs, оптимизированных по производительности библиотек, новую асинхронную модель программирования графов, улучшенную интеграцию CUDA и графического API и новые инструменты разработки. CUDA 10 также предоставляет все составляющие, необходимые для создания серверных платформ NVIDIA для AI и нагрузок высокопроизводительных вычислений (HPC), как локально (DGX-2), так и в облаке (HGX-2).

    TensorRT 5 (доступен с 20 сентября)

    TensorRT 5 показывает до 40 раз производительность вывода по сравнению с CPUs благодаря новым оптимизациям, APIs и поддержке Turing GPUs. Он оптимизирует точность в рекомендательные системах, машинном переводе, обработке естественного языка. Основными особенностями TensorRT 5 являются INT8 APIs, предлагающие новые гибкие схемы работы, оптимизация для глубокой свертки, поддержка платформ NVIDIA Drive на основе Xavier и акселератор NVIDIA DLA. Кроме того, TensorRT 5 поддерживает операционные системы Windows и CentOS. Смотрите туториал.

    cuDNN 7.3

    Главные особенности фреймворка cuDNN 7.3 — улучшенная сгруппированная свертка для формата данных NHWC и расширенная производительность сверток для ResNet50, DeepSpeech2 и Wavenet.

    NCCL 2.3

    Фреймворки, использующие NCCL 2.3 и более поздние версии, заточены на работу с архитектурами Volta и Turing для обеспечения высокой производительности многоузловых и многопроцессорных вычислений глубокого обучения. Новые функции включают улучшенные алгоритмы с низкой задержкой для сообщений небольших размеров и удобная регулировка при использовании графических процессоров Direct P2P и RDMA.

    CUTLASS 1.1

    CUTLASS 1.1 позволяет использовать Tensor Cores Turing для высокопроизводительного умножения матриц в CUDA C ++. Новые особенности включают поддержку CUDA 10 и новых матричных функций для доступа к Turing.

    NVIDIA RTX — NGX SDK

    Архитектура Turing заточена под новейшее GPU — Nvidia RTX. Стоимость новых видеокарт — от $599 до $1199. NGX — новый технологический стек, в котором реализованы алгоритмы, которые ускоряют и улучшают графику, обработку изображений и видео непосредственно в приложениях. NGX SDK использует предварительно подготовленные сети, что позволяет разработчикам легко интегрировать алгоритмы.

    SDK будет доступен в ближайшее время.

    VRWorks Graphics 3.0

    Функциональные особенности VRWorks Graphics предлагают новый уровень визуальной точности, производительности и скорости реагирования в виртуальной реальности. Эта версия, объединенная с Turing на базе GPU, включает в себя переменную скорость раскраски (Variable Rate Shading) и визуализация в нескольких проекциях (Multi-View Rendering). Variable Rate Shading — новая технология визуализации, которая выделяет больше мощности GPU для обработки полутонов детализированных областей сцены и меньшую для менее подробных участков.

    Multi-view рендеринг
    Multi-view рендеринг

    Multi-View Rendering расширяет возможности Single Pass Stereo, увеличивая количество проекционных центров или представлений для одного прохода с двух до четырех. Все четыре вида, доступные за один проход, теперь не зависят от положения и перемещаются вдоль любой оси в проекционном пространстве, что позволяет поддерживать новые конфигурации дисплея.

    Инструменты разработчика

    Nsight Compute 1.0

    NVIDIA Nsight Compute — это инструмент нового поколения, который обеспечивает интерактивную отладку CUDA API и профилирование ядра. Эта версия Nsight Compute предлагает быстрый сбор данных о показателях производительности и отладке API с помощью пользовательского интерфейса и командной строки.

    Nsight Systems 2018.2

    NVIDIA Nsight Systems — это инструмент для анализа производственных характеристик, позволяющий разработчики оптимизировать программное обеспечение, например, выявлять узкие места в процессорах и графических процессорах. Обновления в Nsight Systems 2018.2 включают поддержку CUDA 10, обновление интерфейса командной строки для реализации новых сценариев использования, улучшенную совместимость и удобство использования.

    Nsight Graphics 2018.5

    Nsight Graphics — автономный инструмент разработки, позволяющий отлаживать, профилировать и экспортировать фреймы, созданные с помощью популярных графических API. Версия 2018.5 обеспечивает публичную доступность GPU Trace, поддерживает расширения Direct3D 12 DXR и Vulkan Ray Tracing, расширяет функционал для DirectX 12 и поддерживает Windows RS3 DirectX 12 SDK.

    Nsight VSE 6.0

    NVIDIA Nsight Visual Studio Edition — это среда разработки приложений для GPUs, которая позволяет создавать, отлаживать, профилировать и отслеживать набор приложений. Обновления в Nsight VSE 6.0 включают графическую отладку с поддержкой трассировки лучей, расширенную отладку и анализ с поддержкой CUDA 10.


    Интересные статьи: