Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

16 ноября 2022
andromeda cerebras

Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

Компания Cerebras, производящая самый крупный в мире чип Wafer Scale Engine 2 (WSE-2), представила свой суперкомпьютер Andromeda. Andromeda объединяет 16 чипов WSE-2 размером около 20 сантиметров в один кластер с…

Triton 1.0: язык программирования GPU для нейросетей

7 августа 2021

Triton 1.0: язык программирования GPU для нейросетей

OpenAI представила open-source язык программирования Triton для графических процессоров. Triton схож с Python и позволяет не имеющим опыта работы с CUDA пользователям писать высокоэффективный код. Triton, впервые представленный в 2019-м…

Оценка эффективности инференса нейронных сетей

8 декабря 2019
инференс gpu cpu сравнение производительности

Оценка эффективности инференса нейронных сетей

Развитие рынка нейронных сетей подразумевает под собой удешевление стоимости железа при постоянном росте производительности. Обычно нейронная сеть проходит три жизненных этапа: обучение, деплой и инференс. Если про обучение и деплой…

t-SNE-CUDA: как визуализировать многомерные данные на GPU

22 октября 2019

t-SNE-CUDA: как визуализировать многомерные данные на GPU

t-SNE-CUDA — это оптимизированная имплементация алгоритма t-SNE на GPU. t-SNE используется для визуализации многомерных данных в 2D. t-SNE-CUDA работает в 50-700 раз быстрее предыдущих реализаций. При этом оптимизация не влияет…

Как выдавать предсказания с BERT-Large за 5.8 миллисекунд

20 сентября 2019

Как выдавать предсказания с BERT-Large за 5.8 миллисекунд

NVIDIA обновили инструмент для ускорения инференса модели TensorRT 6. В новой версии TensorRT оптимизировали BERT-Large. BERT-Large — это полная версия модели BERT, state-of-the-art модели в обработке естественного языка. Теперь есть…

Нейросеть анализирует видео с камер во время операций

29 августа 2019

Нейросеть анализирует видео с камер во время операций

Kaliber Labs разрабатывают нейросеть, которая интерпретирует видео с камер внутри пациента во время операций. Модель определяет оперируемую область и выдает рекомендации, которые выводятся на монитор в операционной. Kaliber Labs —…

VideoGorillas используют нейросети для преобразования видео в 4К

26 августа 2019

VideoGorillas используют нейросети для преобразования видео в 4К

Разработчики в VideoGorillas обучили нейросеть улучшать разрешение видео. Нейросеть конвертирует видео из 480p разрешения в 4K. Модель используется для предсказания недостающих пикселей.  За последние несколько лет стандарты видеосъемки значительно возросли.…

В Nvidia обучили языковую модель с 8 миллиардами параметров

14 августа 2019

В Nvidia обучили языковую модель с 8 миллиардами параметров

MegatronLM — это языковая модель с 8.3 миллиардами параметров, которую в Nvidia обучили на 512 GPU. MegatronLM основывается на GPT-2. По размеру MegatronLM больше BERT в 24 раза и больше…

Tensorpack: быстрый интерфейс для обучения нейросетей на TensorFlow

28 июля 2019

Tensorpack: быстрый интерфейс для обучения нейросетей на TensorFlow

Tensorpack — это интерфейс для обучения нейронных моделей, который основан на TensorFlow. Обучение моделей на Tensorpack занимает в 1.2-5 раза меньше времени, чем на Keras, оригинальной высокоуровневой библиотеке на TensorFlow. …

Как выбрать графический процессор для глубокого обучения

26 декабря 2018
hardware gpu machine learning

Как выбрать графический процессор для глубокого обучения

Глубокое обучение требует больших вычислительных ресурсов, поэтому очень важно, какой графический процессор (видеокарту) вы выберете для своих исследований. Надежный GPU позволит быстро вычислять оптимальные архитектуры и настройки глубоких сетей, и…

Глубокое обучение в облаке: полный список GPU провайдеров

24 октября 2018

Глубокое обучение в облаке: полный список GPU провайдеров

Использование облачных GPU для машинного обучения — один из лучших способов выполнения высокопроизводительных вычислений. Не нужно приобретать дорогостоящую аппаратуру и ПО, нанимать специалистов для обслуживания. Публикуем список облачных платформ –…

Архитектура Turing от Nvidia: что она дает и как получить максимум производительности

24 сентября 2018
Turing SDK

Архитектура Turing от Nvidia: что она дает и как получить максимум производительности

Архитектура Turing – одно из главных достижений в компьютерной графике за 20 лет, по заявлению самой Nvidia. Turing SDK теперь доступен для разработчиков. Дизайнеры и художники могут создавать контент с улучшенной…

Сравнение облачных GPU для машинного обучения

25 июня 2018
GPU для машинного обучения

Сравнение облачных GPU для машинного обучения

Результаты тестов популярных GPU для машинного обучения: Amazon AWS, Google Cloud Engine, Hetzner, Leader GPU, IBM, Paperspace. Читайте также: Глубокое обучение в облаке: полный список GPU провайдеров Тестируемые GPU платформы  В этот…

Kepler.gl — мощный инструмент визуализации карт от Uber с открытым исходным кодом

4 июня 2018
Kepler.gl 

Kepler.gl — мощный инструмент визуализации карт от Uber с открытым исходным кодом

Большинство людей сходятся во мнении, что big data — набор данных, который со временем растет в геометрической прогрессии. Проще говоря, такие данные настолько объемны и сложны, что традиционные средства обработки…