GPU для машинного обучения / Нейросети и глубокое обучение

Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

16 ноября 2022

Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

Компания Cerebras, производящая самый крупный в мире чип Wafer Scale Engine 2 (WSE-2), представила свой суперкомпьютер Andromeda. Andromeda объединяет 16 чипов WSE-2 размером около 20 сантиметров в один кластер с…

Triton 1.0: язык программирования GPU для нейросетей

7 августа 2021

Triton 1.0: язык программирования GPU для нейросетей

OpenAI представила open-source язык программирования Triton для графических процессоров. Triton схож с Python и позволяет не имеющим опыта работы с CUDA пользователям писать высокоэффективный код. Triton, впервые представленный в 2019-м…

Оценка эффективности инференса нейронных сетей

8 декабря 2019

инференс gpu cpu сравнение производительности

Оценка эффективности инференса нейронных сетей

Развитие рынка нейронных сетей подразумевает под собой удешевление стоимости железа при постоянном росте производительности. Обычно нейронная сеть проходит три жизненных этапа: обучение, деплой и инференс. Если про обучение и деплой…

t-SNE-CUDA: как визуализировать многомерные данные на GPU

22 октября 2019

t-SNE-CUDA: как визуализировать многомерные данные на GPU

t-SNE-CUDA — это оптимизированная имплементация алгоритма t-SNE на GPU. t-SNE используется для визуализации многомерных данных в 2D. t-SNE-CUDA работает в 50-700 раз быстрее предыдущих реализаций. При этом оптимизация не влияет…

Как выдавать предсказания с BERT-Large за 5.8 миллисекунд

20 сентября 2019

Как выдавать предсказания с BERT-Large за 5.8 миллисекунд

NVIDIA обновили инструмент для ускорения инференса модели TensorRT 6. В новой версии TensorRT оптимизировали BERT-Large. BERT-Large — это полная версия модели BERT, state-of-the-art модели в обработке естественного языка. Теперь есть…

Нейросеть анализирует видео с камер во время операций

29 августа 2019

Нейросеть анализирует видео с камер во время операций

Kaliber Labs разрабатывают нейросеть, которая интерпретирует видео с камер внутри пациента во время операций. Модель определяет оперируемую область и выдает рекомендации, которые выводятся на монитор в операционной. Kaliber Labs —…

VideoGorillas используют нейросети для преобразования видео в 4К

26 августа 2019

VideoGorillas используют нейросети для преобразования видео в 4К

Разработчики в VideoGorillas обучили нейросеть улучшать разрешение видео. Нейросеть конвертирует видео из 480p разрешения в 4K. Модель используется для предсказания недостающих пикселей. За последние несколько лет стандарты видеосъемки значительно возросли.…

В Nvidia обучили языковую модель с 8 миллиардами параметров

14 августа 2019

В Nvidia обучили языковую модель с 8 миллиардами параметров

MegatronLM — это языковая модель с 8.3 миллиардами параметров, которую в Nvidia обучили на 512 GPU. MegatronLM основывается на GPT-2. По размеру MegatronLM больше BERT в 24 раза и больше…

Tensorpack: быстрый интерфейс для обучения нейросетей на TensorFlow

28 июля 2019

Tensorpack: быстрый интерфейс для обучения нейросетей на TensorFlow

Tensorpack — это интерфейс для обучения нейронных моделей, который основан на TensorFlow. Обучение моделей на Tensorpack занимает в 1.2-5 раза меньше времени, чем на Keras, оригинальной высокоуровневой библиотеке на TensorFlow. …

Как выбрать графический процессор для глубокого обучения

26 декабря 2018

Как выбрать графический процессор для глубокого обучения

Глубокое обучение требует больших вычислительных ресурсов, поэтому очень важно, какой графический процессор (видеокарту) вы выберете для своих исследований. Надежный GPU позволит быстро вычислять оптимальные архитектуры и настройки глубоких сетей, и…

Глубокое обучение в облаке: полный список GPU провайдеров

24 октября 2018

Глубокое обучение в облаке: полный список GPU провайдеров

Использование облачных GPU для машинного обучения — один из лучших способов выполнения высокопроизводительных вычислений. Не нужно приобретать дорогостоящую аппаратуру и ПО, нанимать специалистов для обслуживания. Публикуем список облачных платформ –…

GPU для машинного обучения

Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

Triton 1.0: язык программирования GPU для нейросетей

Triton 1.0: язык программирования GPU для нейросетей

Оценка эффективности инференса нейронных сетей

Оценка эффективности инференса нейронных сетей

t-SNE-CUDA: как визуализировать многомерные данные на GPU

t-SNE-CUDA: как визуализировать многомерные данные на GPU

Как выдавать предсказания с BERT-Large за 5.8 миллисекунд

Как выдавать предсказания с BERT-Large за 5.8 миллисекунд

Нейросеть анализирует видео с камер во время операций

Нейросеть анализирует видео с камер во время операций

VideoGorillas используют нейросети для преобразования видео в 4К

VideoGorillas используют нейросети для преобразования видео в 4К

В Nvidia обучили языковую модель с 8 миллиардами параметров

В Nvidia обучили языковую модель с 8 миллиардами параметров

Tensorpack: быстрый интерфейс для обучения нейросетей на TensorFlow

Tensorpack: быстрый интерфейс для обучения нейросетей на TensorFlow

Как выбрать графический процессор для глубокого обучения

Как выбрать графический процессор для глубокого обучения

Глубокое обучение в облаке: полный список GPU провайдеров

Глубокое обучение в облаке: полный список GPU провайдеров

Архитектура Turing от Nvidia: что она дает и как получить максимум производительности

Архитектура Turing от Nvidia: что она дает и как получить максимум производительности

Сравнение облачных GPU для машинного обучения

Сравнение облачных GPU для машинного обучения

Kepler.gl — мощный инструмент визуализации карт от Uber с открытым исходным кодом

Kepler.gl — мощный инструмент визуализации карт от Uber с открытым исходным кодом